Willkommen Willkommen bei Recognita Plus 5.0, dem mehrsprachigen OCR-Programm für Windows 95, Windows 98, Windows NT 4.0 und Windows 2000. Mit Hilfe dieses Programmes können Sie gedruckte Dokumente bzw. Bilddateien auf einfache Art und Weise in den Computer einlesen und dort weiterbearbeiten. Die vorliegende Dokumentation wird Ihnen beim Einstieg in die Arbeit mit Recognita Plus helfen. Dieses Handbuch Dieses Handbuch soll Ihnen ein gewisses Grundwissen über Recognita Plus vermitteln. Es enthält Hinweise zur Installation und Einrichtung des Programmes, bietet Ihnen eine Einführung in das Thema Optische Zeichenerkennung und erläutert, wozu die Software in der Lage ist. Desweiteren beschreibt es, welche Schritte durchgeführt werden müssen, um ein Dokument zu verarbeiten. Das Handbuch geht dabei jedoch nicht auf jede einzelne Besonderheit oder Funktion des Programmes ein. Elektronische Online-Hilfe Wenn Sie ausführlichere Informationen zu einzelnen Funktionen, Einstellungen und Arbeitsvorgängen benötigen, sollten Sie die Elektronische Online-Hilfe zu Rate ziehen. Diese enthält Antworten zu einer großen Fülle von Fragen. Tip des Tages Jedesmal wenn Sie das Programm starten, erscheint ein Fenster mit dem Tip des Tages (es sei denn, Sie haben diese Funktion abgeschaltet). In diesem Fenster werden nützliche Hinweise zu verschiedenen Funktionen von Recognita Plus angezeigt. Indem Sie diese Hinweise lesen und berücksichtigen, werden Sie nach und nach immer mehr der Möglichkeiten von Recognita Plus für sich ausnutzen können. Unterstützte Scanner Siehe Abschnitt "Systemanforderungen" für Informationen zu dem Scanner, den Sie mit Recognita Plus benutzen möchten. Kapitel 1 Installation und Einrichtung In diesem Kapitel finden Sie Informationen zu den folgenden Themen: * Systemanforderungen * Installation * Einrichtung des Scanners für Recognita Plus * Registrierung Systemanforderungen Um Recognita Plus installieren und benutzen zu können, benötigen Sie zumindest folgende Konfiguration: * IBM-kompatiblen PC mit Intel Pentium oder gleichwertigem Prozessor. * Betriebssystem Microsoft Windows 95, Windows 98, Windows NT 4.0 oder Windows 2000. * 8 MB Hauptspeicher (RAM) für Windows 95 und Windows 98 (16 MB empfohlen). 16 MB Hauptspeicher (RAM) für Windows NT 4.0 und Windows 2000 (32 MB empfohlen). * 35 bis 45 MB freie Festplattenkapazität, je nach den von Ihnen bei der Installation gewählten Optionen. Um Ihre Arbeit mit Recognita Plus zu speichern, benötigen Sie wesentlich mehr Platz, vor allem dann, wenn Sie lange mehrseitige Dokumente erstellen und Bilder in Ihre Recognita-Dokumente einbinden. * Wenn Sie Ihre gedruckten Dokumente selber einscannen möchten, benötigen Sie einen unterstützten Scanner mit einer Auflösung von 300 oder 400 dpi. Informationen zu den direkt unterstützten Scannern finden Sie in den mitgelieferten Dateien SCAN_???.RTF (die Endung xxx hängt von der Sprache der Datei ab, ger steht zum Beispiel für Deutsch, eng für Englisch). Über die Verknüpfung "Recognita Scannertreiber" in der Recognita Programmgruppe erhalten Sie Zugriff auf den Dateiinhalt in Ihrer Sprache. Weitere Informationen finden Sie auf unserer Internet-Seite www.caere.com/recognita Informationen zu Scannern, die mit Hilfe von Caere's Scan Manager angesteuert werden können, finden Sie über die Verknüpfung "Scanner Setup Notes - Caere Scan Manager" in der Recognita Programmgruppe. Sie können in Recognita Plus aber auch ohne Scanner arbeiten, indem Sie nur Bilddateien verwenden. * VGA-Monitor (möglichst mit 256 oder mehr Farben). * Maus oder anderes Zeigegerät. * CD-ROM-Laufwerk für die Installation. Installation Dieses Kapitel führt Sie Schritt für Schritt durch die Installation des Programmes. Schließen Sie bitte zuerst alle laufenden oder automatisch gestarteten Anwendungen. Wichtig: Unter Windows NT 4.0 und Windows 2000 benötigen Sie Administrator- Privilegien, um das Programm installieren zu können. Und so installieren Sie Recognita Plus: 1. Legen Sie die CD-ROM mit Recognita Plus 5.0 in Ihr CD-ROM-Laufwerk ein. Warten Sie, bis setupocr.exe automatisch startet. Falls es dies nicht tut, wählen Sie entweder im Windows Explorer oder im Dialogfenster Durchsuchen der Startmenü-Funktion Ausführen Ihr CD-ROM-Laufwerk aus und starten Sie setupocr.exe aus dem Hauptverzeichnis der CD. 2. Als erstes werden Sie dazu aufgefordert, den CD-Schlüssel einzugeben. Diesen finden Sie auf der Rückseite der CD-Hülle. 3. Von nun an werden Sie vom Recognita Installationsassistenten durch die Installation geführt. Wählen Sie eine Sprache für die Installation und folgen Sie den Anweisungen am Bildschirm. 4. Klicken Sie bei jedem Schritt der Installation auf Weiter, nachdem Sie alle Einstellungen vorgenommen haben oder klicken Sie auf Zurück, um irgendwelche Einstellungen wieder zu ändern. 5. Klicken Sie auf Fertig, um mit der eigentlichen Installation zu beginnen und alle Dateien in den angegebenen Ordner kopieren zu lassen. 6. Anschließend können Sie in dem erscheinenden Dialogfenster folgende Einstellungen vornehmen: * die Programmsprache (d.h. die für Menüs, Meldungen usw. verwendete Sprache) * die Sprache für die Hilfedateien * Textausgabefilter * Wörterbücher für Rechtschreibkontrolle und Sprachanalyse * Direktverbindungen zu anderen Anwendungen und Einbin-dung in Mail- Programme. Hinweis: Im Verlauf der Installation wird auch ein Symbol für das Maintenance Setup von Recognita Plus in die Programmgruppe Recognita Plus 5.0 eingefügt. Mit Hilfe dieses Programmes können Sie später Änderungen an der aktuellen Konfiguration von Recognita Plus vornehmen, zum Beispiel um einen neuen Scannertreiber oder Textfilter zu installieren, eine Direktverbindung einzurichten usw. Außerdem finden Sie in dieser Programmgruppe auch eine Funktion zum Deinstallieren des Programmes. Einrichtung des Scanners für Recognita Plus Recognita Plus kann Ihren Scanner auf verschiedene Weise ansprechen. Die einfachste Methode ist die Benutzung von Caere's Scan Manager, der daher bei der Installation als Standardtreiber eingestellt wird. Scan Manager ist eine regelmäßig aktualisierte Software von Caere und bietet eine einheitliche Zugriffsmöglichkeit auf viele verschiedene Scanner. Der Scan Manager wird während der Installation von Recognita Plus automatisch installiert. Dabei wird ein Dialogfenster mit einer Liste von Scannermodellen angezeigt. Benutzen Sie diese Liste nur, wenn Sie über den Scan Manager scannen möchten. Ansonsten stellen Sie 'Kein Scanner' ein. Der erste Eintrag der Liste lautet (Allgemein). Wählen Sie diesen Eintrag aus, wenn Sie "Keinen Scanner" oder einen generischen TWAIN- bzw. ISIS-Treiber installieren möchten. In den letzteren beiden Fällen sollten Sie überprüfen, ob die Standardeinstellungen für Ihren Scanner geeignet sind. Um einen bestimmten Scanner auszuwählen, klicken Sie zunächst auf den Herstellernamen, um sich eine Liste aller Modelle dieses Herstellers anzeigen zu lassen. Wählen Sie anschließend den gewünschten Scanner aus. Scan Manager steuert den gewählten Scanner normalerweise über die TWAIN-Schnittstelle, nimmt aber alle notwendigen Einstellungen automatisch vor. Das Installationsprogramm des Scan Managers fügt ein Symbol in die Systemsteuerung von Windows ein. Um den installierten Scanner zu wechseln oder dessen Einstellungen zu ändern, müssen Sie nur auf dieses Symbol klicken. Falls Sie keinen Scanner haben, können Sie trotzdem mit Recognita Plus arbeiten und Bilddateien verarbeiten, die von einer anderen Scanner-Software, einem Fax-Board oder aus einer eMail stammen. In diesem Fall müssen Sie Scan Manager entfernen oder (Allgemein)/Kein Scanner auswählen. Falls Sie Probleme mit Ihrem Scanner haben, lesen Sie bitte den nächsten Abschnitt "Ändern der Scanner-Einstellungen". Ändern der Scanner-Einstellungen Bevor Sie die Scanner-Einstellungen verändern, sollten Sie sich zunächst vergewissern, daß der Scanner mit der vom Hersteller des Scanners mitgelieferten Software funktioniert. Während des Setups sollte der Scanner eingeschaltet sein. Sie können die Scanner-Einstellungen mit Hilfe des Recognita Maintenance Setups ändern. Sie haben folgende Möglichkeiten zur Ansteuerung Ihres Scanners: * Mit Hilfe eines von Caere's Scan Manager unterstützten Scanners. * Mit Hilfe eines allgemeinen Scannertreibers von Caere's Scan Manager. * Mit Hilfe eines der mit Recognita Plus ausgelieferten Scannertreiber. * Mit Hilfe des mit Recognita Plus ausgelieferten TWAIN-Treibers. Beim Aufruf des Recognita Maintenance Setups wird folgendes Dialogfenster angezeigt: Als erster Eintrag in der Liste der installierten Scannerteiber erscheint Scan Manager. Der entsprechende Treiber wird automatisch in die Liste der installierten Scanner eingetragen und als Standardscanner markiert. Lassen Sie den Treiber dort stehen, falls Sie den Scan Manager benutzen möchten. Welchen Scanner Sie verwenden wollen, müssen Sie in diesem Fall in einem anderen Dialogfenster angeben, das später erscheint. Falls Sie den Scan Manager nicht verwenden möchten, entfernen Sie den Treiber oder wählen Sie einen der anderen, von Recognita mitgelieferten Treiber und machen Sie ihn zum Standardtreiber. Im folgenden Text wird erklärt, wie Sie einen Recognita Scanner-Treiber installieren können, falls es Probleme mit dem Scan Manager gibt. Und so richten Sie Ihren Scanner ein: 1. Schalten Sie Ihren Scanner ein. 2. Wählen Sie Ihr Scannermodell aus der Liste der installierten Scannertreiber. 3. Klicken Sie auf Installieren. Der Name des markierten Treibers wird daraufhin in der Liste der installierten Scanner erscheinen. Falls Sie mehrere Scanner an Ihren Computer angeschlossen haben, können Sie auf diese Weise alle Treiber installieren. 4. Es erscheint ein Dialogfenster mit den Standardeinstellungen des Scanners. In diesem Fenster sehen Sie verschiedene Einstellungen wie Portadresse, Interrupt-Werte, Schnittstellenkarten usw. Grau dargestellte Einstellungen werden für den gewählten Scanner nicht benötigt. Überprüfen Sie, ob alle Werte korrekt sind. Geben Sie an, ob ein Automatischer Seiteneinzug (ADF) oder eine Transpa-renzeinheit an Ihren Scanner angeschlossen ist. 5. Klicken Sie auf Scannerschnittstelle überprüfen, um Ihre Konfiguration überprüfen zu lassen und zu sehen, ob alle angegebenen Informationen korrekt sind. Falls nicht, wird eine Meldung erscheinen und Sie darauf hinweisen, welche Werte geändert werden müssen. Dies kann zum Beispiel eine benötigte Schnittstellenkarte sein, die nicht automatisch gefunden wurde, eine falsch eingestellte Portadresse usw. Falls Sie das Problem nicht sofort lösen können, sollten Sie trotzdem mit der Einrichtung fortfahren, anschließend die Datei SCAN_???.RTF mit den Standardeinstellungen für alle Scanner zu Rate ziehen, noch einmal das Maintenance Setup starten und dort die benötigten Werte einstellen. 6. Klicken Sie auf OK, um zum Hauptfenster zurückzukehren. 7. Falls Sie mehr als einen Scanner installiert haben, müssen Sie einen davon als momentan benutzten markieren und auf die Schaltfläche Als Standardscanner klicken. Sie können den Standardscanner später jederzeit wieder wechseln, indem Sie erneut das Maintenance Setup aufrufen. 8. Um einen der installierten Scanner wieder zu entfernen, müssen Sie ihn in der Liste der installierten Scanner markieren und auf die Schaltfläche Entfernen klicken. Einrichtung TWAIN-kompatibler Scanner: TWAIN ist eine Standardschnittstelle für alle Bilder generierenden Geräte. Die meisten Scannerhersteller liefern zusammen mit Ihren Scannern TWAIN-kompatible Treiber aus. Recognita Plus besitzt eigene, scannerspezifische Treiber für viele verschiedene Scannermodelle und unterstützt darüber hinaus auch TWAIN. Falls Sie einen TWAIN-kompatiblen Scanner an Ihren Computer angeschlossen haben, können Sie während der Installation bzw. später im Recognita Maintenance Setup einen der TWAIN-spezifischen Einträge aus der Liste der verfügbaren Scannertreiber auswählen. Die Liste enthält dabei einen allgemeinen Eintrag für TWAIN: TWAIN: Basic Driver sowie einen oder zwei Einträge für jeden installierten TWAIN-kompatiblen Scanner in folgender Form: TWAIN: Zwei Einträge werden nur dann angezeigt, wenn unter Windows 95 oder 98 sowohl eine 16-Bit- als auch eine 32-Bit-Datenquelle installiert wurde. Falls verfügbar, sollten Sie stets den 32-Bit-Treiber benutzen. Hinweis: Falls der Name Ihres TWAIN-kompatiblen Scannermodells auch als eigener Eintrag in der Treiberliste steht (ohne "TWAIN" am Anfang des Namens), sollten Sie diesen Treiber verwenden, damit Recognita Plus Ihren Scanner über seinen eigenen Scannertreiber ansprechen kann. Auswählen eines Eintrags "TWAIN:": Der enthält den Produktnamen der jeweiligen Datenquelle (dieser unterscheidet sich oftmals von der eigentlichen Bezeichnung des Scannermodells). Sie sollten stets diesen Treiber statt des Treibers "TWAIN: Basic Driver" auswählen, da Sie in diesem Fall alle Scannereinstellungen über die Oberfläche von Recognita Plus vornehmen können. Auswählen des Eintrags "TWAIN: Basic Driver": Der Treiber "TWAIN: Basic Driver" sollte nur dann verwendet werden, wenn Sie beim Scanner mit einem Treiber vom Typ "TWAIN:" Probleme haben. Falls Sie den Treiber "TWAIN: Basic Driver" verwenden, können die Scannereinstellungen in einem Dialogfenster der Datenquelle, das beim Beginn des Scanvorgangs in Recognita Plus erscheint, vorgenommen werden. Sobald Sie Schritt 5. bzw. Schritt 6. der Scanner-Einrichtung beendet haben (siehe Seiten 12), erscheint ein Dialogfenster "Quelle wählen" mit einer Liste aller installierten Datenquellen. Diese Namen sind identisch mit den Namen aus den Einträgen vom Typ "TWAIN:", diesmal erscheinen sie jedoch ohne den Präfix "TWAIN". Sie sollten an dieser Stelle angeben, welchen Treiber Sie mit Hilfe des Treibers "Twain Basic Driver" von Recognita Plus benutzen möchten. Andere TWAIN-Probleme Die Oberfläche der TWAIN-Datenquelle kann auch Einstellungen anbieten, die sich nicht für OCR-Zwecke eignen. Dies können zum Beispiel extreme Auflösungswerte, Halbtonbilder, und andere Einstellungen sein. Bitte vermeiden Sie solche Einstellungen, um bestmögliche Ergebnisse zu erhalten. In manchen Fällen verwendet Recognita Plus den Treiber "TWAIN: Basic Driver", obwohl Sie einen Treiber vom Typ "TWAIN: " gewählt haben. Dies ist kein Fehler, sondern kommt vor, wenn Recognita Plus feststellt, daß es nicht alle benötigten Scannereinstellungen steuern kann. Denken Sie daran, daß in diesem Fall alle Scannereinstellungen im Dialogfenster der Datenquelle vorgenommen werden können. Falls Sie mit dem Treiber "TWAIN: Basic Driver" arbeiten, können Sie versuchen, die Ansteuerung des Automatischen Seiteneinzugs über den Datenquellentreiber zu aktivieren. Fügen Sie dazu in die Datei scanner.ini im Ordner von Recognita Plus folgende Zeile ein: AdfHandling=1 Falls dies funktioniert, wird das Dialogfenster der Datenquelle nur vor der ersten Seite des Stapels angezeigt. Ansonsten erscheint es vor jeder Seite. Spezielle Scannerprobleme unter Windows 95 und Windows 98 Falls Sie unter Windows 95 beim Scannen eine Fehlermeldung erhalten und es sich dabei scheinbar nicht um einen tatsächlichen Fehler am Scanner handelt, sollten Sie die folgende Zeile in die Datei CONFIG.SYS unmittelbar hinter die Einträge für HIMEM.SYS und EMM386.EXE eintragen: DEVICE=\RSDBUF.EXE [/8] wobei der vollständige Pfadname von Recognita Plus ist. Bitte beachten Sie, daß Sie bei diesem Eintrag nicht DEVICEHIGH verwenden dürfen. Dieser Treiber sorgt dafür, daß der Pufferspeicher für die Scannertreiber von Recognita im konventionellen Speicherbereich angelegt werden. Falls die Option /8 angegeben wird, wird weniger Speicher belegt (8k). Benutzen Sie den Schalter /8 nicht für folgende Scannertypen: * Ricoh RS632 mit ISI-8 Schnittstellenkarte * Siemens-Scanner * Lightscan 400P * Pentax DS6, DS10 * Mitsubishi MH216CG * AVision-Scanner * Dextra Reader * Genius FastReader * Mouse Systems PB/Reader * Targa TS 30n, TS 600C, TS 800C Registrierung Registrierte Benutzer von Recognita Plus 5.0 erhalten: * Zugang zum technischen Support * die neuesten Informationen über neue und verbesserte Recognita-Produkte * Update-Angebote zu besonderen Preisen. Nicht registrierte Benutzer werden beim Start von Recognita Plus regelmäßig dazu aufgefordert, sich zu registrieren. Sobald Sie sich registriert haben, werden Sie nicht mehr dazu aufgefordert. Als Ergebnis der Registrierung erhalten Sie eine Registriernummer, die in das entsprechende Eingabefeld des Recognita Registrierungsassistenten eingetragen werden muß. Und so erhalten Sie Ihre Registriernummer: 1. Wählen Sie Registrierung... aus dem Hilfe-Menü, um den Recognita Registrierungsassistenten aufzurufen. Dieses Programm wird beim ersten Start von Recognita Plus automatisch gestartet. 2. Klicken Sie im ersten Fenster auf Weiter. Daraufhin erscheint das folgende Fenster: 3. Um sich registrieren zu lassen, wählen Sie eine der drei angebotenen Möglichkeiten. Klicken Sie nacheinander jede der drei Methoden an, um zu sehen, was jeweils damit gemeint ist. Online Wenn Sie Online wählen und auf Weiter klicken, werden Sie zu unserer Registrierungs-Homepage geführt, wo Sie ein elektronisches Formular ausfüllen können und sofort Ihre Registriernummer erhalten. Anschließend können Sie zum Registrierungs-Assistenten zurückschalten, Ihre Nummer eingeben und mit einem Klick auf Weiter überprüfen lassen. Offline Wenn Sie Offline wählen und auf Weiter klicken, wird innerhalb des Registrierungs-Assistenten ein elektronisches Formular angezeigt. Füllen Sie es aus und klicken Sie bei jeder neuen Seite auf Weiter. Wenn Sie auf Registrieren klicken, wird das Programm zuerst eine eMail-Verbindung und dann ein Fax-Modem suchen. Es wird Sie anschließend darüber informieren, wie es das Formular abgeschickt hat. Hat keine der beiden Methoden funktioniert, wird das Formular für Sie ausgedruckt. Steht kein Drucker zur Verfügung, erhalten Sie die Möglichkeit, das Formular auf Diskette abzuspeichern. Sie können uns in diesem Fall das Formular faxen oder per Post zuschicken oder einfach die in der Schachtel enthaltene Registrierkarte ausfüllen. Ihre Registriernummer erhalten Sie dann per eMail, Fax oder Post. Klicken Sie auf OK, um den Registrierungs-Assistenten zu verlassen. Telefon In einigen Ländern (zur Zeit Deutschland, Polen, Schweden, Tschechien und Ungarn) können Sie sich auch telefonisch registrieren lassen. Klicken Sie auf Telefon und dann auf die aufklappbare Liste, um zu sehen, welche Nummer Sie wählen müssen. Bitte halten Sie Ihre Seriennummer bereit. Falls möglich, lassen Sie sich während des Gesprächs den Registrierungs-Assistenten anzeigen, so daß Sie sofort Ihre Registriernummer eingeben und mit einem Klick auf Weiter überprüfen können. Und so schließen Sie die Registrierung ab: 1. Wählen Sie Registrierung... aus dem Hilfe-Menü, um den Recognita Registrierungs-Assistenten zu starten, falls er nicht bereits läuft. 2. Begeben Sie sich zum Fenster "Art der Registrierung" und geben Sie Ihre Registriernummer in das entsprechende Textfeld ein. 3. Klicken Sie auf Weiter, um die Nummer überprüfen zu lassen und die Registrierung abzuschließen. 4. Bewahren Sie die Nummer an einem sicheren Platz auf; wir empfehlen dazu die speziell hierfür vorgesehene letzte Seite des Benutzerhandbuches. Kapitel 2 Einführung in Recognita Plus Haben Sie Ihre Tastatur jemals so richtig satt gehabt? Falls die Antwort auf diese Frage "Nein" lautet, sind Sie ein ganz Glücklicher, was jedoch eher unwahrscheinlich ist. Falls die Antwort "Ja" lautet, dann wissen Sie wahrscheinlich, wie ermüdend das Abtippen eines gedruckten Dokuments sein kann. Aber warum sollten Sie Ihre wertvolle Zeit verschwenden, wenn sich direkt vor Ihren Augen eine Lösung für Ihr Problem befindet. Die Lösung ist - wie Sie wahrscheinlich bereits vermutet haben - Recognita Plus. Diese schriftartenunabhängige und vielsprachige OCR-Software wandelt Ihre gedruckten Dokumente mit Leichtigkeit und Genauigkeit in computerlesbare Form um. Sobald Sie einmal damit begonnen haben, Recognita Plus zu benutzen, werden Sie sehr bald davon überzeugt sein, daß diese Software das Ende einer Ära bedeutet - der Ära der manuellen Datenerfassung. In diesem Kapitel finden Sie Informationen zu den folgenden Themen: * Worum geht es bei OCR eigentlich? * Verarbeitungsphasen in Recognita Plus * Das Recognita-Dokument * Programm- und Dokumentfenster * Benutzung der Elektronischen Online-Hilfe * Was ist neu im Vergleich zu Version 4.0? * Produkt-Support Worum geht es bei OCR eigentlich? Optische Zeichenerkennung ist die Kunst oder Wissenschaft vom Scannen gedruckter Dokumente und der Umwandlung ihrer Inhalte in computerlesbare Form. Das Programm untersucht dabei die gescannten Formen und entscheidet, welche Zeichen sie darstellen. Die von Recognita Plus verwendete Technik basiert hauptsächlich auf der sogenannten Konturenanalyse, bei der jedes Zeichen durch bestimmte Maße oder Längenverhältnisse seiner einzelnen Konturelemente bestimmt wird. Diese Methode hat den Vorteil, daß die Erkennung omnifont ist, d.h. relativ unabhängig von Zeichengröße und Variationen der Schriftart. Zusätzlich zu seinem Grundalgorithmus benutzt das Programm die Self Assertion Technology (SAT), die mit einem verbesserten Mustervergleich arbeitet. Außerdem verwendet die OCR-Engine das Sprachanalysemodul der jeweiligen Erkennungssprache, um die aus den erkannten Zeichen zusammengesetzten Wörter zu untersuchen. All diese Techniken zusammengenommen, gewährleisten eine optimale Erkennung. Mit Recognita Plus 5.0 wurde für die elf wichtigsten Sprachen eine neue Qualität der Erkennungsgenauigkeit eingeführt. Das Programm enthält jetzt zwei Erkennungs-Engines, beide mit eigener Sprachanalyse. Die beiden Engines lesen parallel zueinander den Text ein und vergleichen anschließend ihre Ergebnisse. Falls sich dabei Unterschiede ergeben, wird mit Hilfe der Sicherheitsinformationen beider Engines die beste Lösung ausgewählt. Tests mit Dokumenten schlechter Qualität haben ergeben, daß die Anzahl der Fehler um bis zu 30% reduziert werden konnte. Verarbeitungsphasen in Recognita Plus Menschen sind nicht alle gleich. Genausowenig gleichen sich die Aufgaben, die sie Tag für Tag zu lösen haben. Was sie jedoch alle gebrauchen können, ist ein flexibles Werkzeug, das ihnen das Leben leichter macht und an ihre Bedürfnisse angepaßt werden kann. Recognita Plus ist ein sehr vielseitiges Programm, das auf viele verschiedene Weisen benutzt werden kann, um einseitige oder mehrseitige Dokumente zu verarbeiten. Dabei ist alles möglich, von schrittweiser manueller Bedienung bis hin zur vollautomatischen Dokumentverarbeitung. Dieses Handbuch kann zwar nicht auf alle Möglichkeiten eingehen, beschreibt aber die typischen Schritte bei der Verarbeitung. Außerdem richtet es Ihre Aufmerksamkeit auf die Einstellmöglichkeiten, die bestimmen, wie ein Dokument Recognita Plus durchläuft. Mehr zu diesen Einstellungen finden Sie in den entsprechenden Abschnitten der Online-Hilfe von Recognita Plus. Verarbeitungsphasen in Recognita Plus 1. Bild scannen / laden Zuerst benötigen Sie eine Eingabe. Diese kann durch Einscannen eines Dokuments und Erstellen eines digitalisierten Abbilds erfolgen oder durch Öffnen einer bereits vorhandenen Bilddatei in Recognita Plus, vom Desktop oder Explorer, oder durch Verwendung eines Bildanhangs aus einer e-mail. Scannen und Bildimport können schwarzweiß, in Graustufen oder farbig erfolgen. Alle Bilder werden stets wie im Original angezeigt. 2. Bildvorverarbeitung Das Programm bereitet die erworbenen Bilder optimal für die Erkennung auf, indem es eventuelle Schräglagen automatisch bestimmt und korrigiert und die Seite richtig herum dreht. (Die Seitenlage kann entweder von Ihnen vorgegeben oder vom Programm automatisch ermittelt werden.) 3. Layoutanalyse, Zoneneinrichtung Hierzu gehören die Suche nach Informationen auf der Seite und die Einrichtung von Zonen. Das Programm unterscheidet automatisch zwischen Text und Graphiken; Texte werden als Fließtext oder Tabellen klassifiziert. Das Programm kann außerdem die Lesereihenfolge der Zonen bestimmen. Die Zoneneinrichtung kann auch von Hand erfolgen. Sie können Zonen einzeichnen, ihre Größe, Position bzw. Reihenfolge ändern und eine andere Erkennungsfunktion zuweisen. Es können auch Zonenschablonen aus Dateien verwendet werden. 4. Erkennung Dies ist der eigentliche Kern des Programmes. Bei der Erkennung werden entsprechend den eingestellten Zoneneigenschaften eine oder mehrere von sechs Erkennungsfunktionen benutzt. Die zur Verfügung stehenden Funktionen sind: Omnifont (wird am häufigsten benutzt), Nadeldruck, Ankreuzung, Braille, Strichkode und Handschrift (nur für Zahlen). Als ein Ergebnis des Erkennungsvorgangs erhalten Sie ein Recognita-Dokument mit formatiertem, editierbarem Text. Normalerweise hält die Verarbeitung nach diesem Schritt an. Anschließend können einzelne Seiten noch einmal mit veränderten Einstellungen gelesen werden. 5. Korrektur, Training, Bearbeitung Diese Funktionen machen zusammen die Korrekturphase aus und werden vollständig vom Benutzer gesteuert. Bei der Korrektur hilft Ihnen das Programm dabei, Problembereiche wie Wörter, die nicht im Wörterbuch enthalten sind, oder verdächtige Zeichen zu finden. Training kann verwendet werden, um dem Programm Zeichen beizubringen, die es wiederholt fehlinterpretiert hat. Der eingebaute Editor bietet die meisten normalen Funktionen zur Bearbeitung, Korrektur und Formatierung des erkannten Textes. 6. Speichern und Export Sie können den erkannten Text in vielen verschiedenen Text-formaten mit verschiedenen Formatierungen abspeichern. Bilder können ebenfalls in verschiedenen Bilddateiformaten abge-speichert werden. Zusätzlich dazu können Sie Ihre Arbeit auch als ein Recognita-Dokument, das sowohl Text als auch Bilder enthalten kann, abspeichern, um es später weiterzuverarbeiten. Außerdem können Sie Daten in die Zwischenablage kopieren und als Mailanhänge versenden. Dieser Schritt kann entweder manuell oder automatisch erfolgen. Das Recognita-Dokument Ein Recognita-Dokument (Dateierweiterung RCD) besteht aus Seiten, die sowohl die Bilder Ihres Dokuments bzw. Verknüpfungen dazu als auch - falls bereits erkannt - den Text in editierbarer Form enthalten. Außerdem werden verschiedene Daten zu den Bildern und Texten auf einer Seite gespeichert. Das dabei verwendete Dateiformat wird nur von Recognita Plus benutzt. Jedes Zeichen bzw. erkannte Bildelement ist mit dem zugehörigen Ausschnitt des Originalbildes verknüpft, da ansonsten Funktionen wie Korrektur, Bildvergleich und Training nicht funktionieren könnten. Recognita-Dokumentdateien können vom Programm gespeichert und später wieder geöffnet werden. Dadurch erhalten Sie die Möglichkeit zur Aufgeschobenen Verarbeitung, um zum Beispiel an einem Tag zu scannen, am nächsten zu erkennen und am dritten Tag oder zu einem späteren Zeitpunkt die Nachbearbeitung mit allen dabei zur Verfügung stehenden Funktionen durchzuführen und den Text zu speichern. Sie sollten Ihre Recognita-Dokumentdateien solange aufbewahren, bis Sie sicher sind, daß Sie den Inhalt der Dateien nicht mehr in einem der von Recognita Plus unterstützten Formate speichern möchten. Programm- und Dokumentfenster Recognita Plus kann mehrere Dokumentfenster gleichzeitig anzeigen. Recognita- Dokumente werden in getrennten Fenstern auf der Arbeitsfläche des Hauptfensters angezeigt. In der folgenden Abbildung sehen Sie ein typisches, auf maximale Größe vergrößertes Dokumentfenster. Um Informationen zu den verschiedenen Bildschirmelementen, ihren Zweck und ihre Benutzung zu bekommen, sollen Sie die kontextsensitive Hilfe benutzen. Benutzung der Elektronischen Online-Hilfe Recognita Plus bietet Ihnen ein umfangreiches Hilfesystem: sowohl kontextsensitive als auch allgemeine Hilfe. In der Hilfe finden Sie ausführliche Informationen zu Funktionen, Einstellungen und Arbeitsvorgängen. Das Hilfe-Menü * Wählen Sie Hilfe verwenden, um sich einen Überblick zur Benutzung der Hilfe anzeigen zu lassen. * Wählen Sie Inhalt, um sich die verfügbaren Informationen nach Kategorien unterteilt anzeigen zu lassen, einen Eintrag aus dem Hilfe-Index auszuwählen oder die Hilfethemen nach bestimmten Wörtern oder Wortgruppen zu durchsuchen. * Wählen Sie einen der Menüpunkte aus dem Untermenü Recognita im Web, um eine der Web-Seiten von Recognita anzusteuern und neueste Informationen zu Produkten, Problemen, unterstützten Scannern usw. zu erhalten. * Wählen Sie Tip des Tages, um nützliche Ideen und Vorschläge zur Benutzung von Recognita Plus zu bekommen. Das Fenster mit dem Tip des Tages wird bei jedem Start von Recognita Plus angezeigt, es sei denn, Sie schalten diese Funktion ab. Das kontextsensitive Hilfe-System: * ToolTips zeigen kurze Erläuterungen zu allen Bildschirmele-menten an, vor allem zu den Schaltflächen auf den Symbolleisten. Sie erscheinen, sobald der Mauszeiger für etwa eine Sekunde bewegungslos über einer Schaltfläche verharrt. * Hinweise in der Statuszeile geben nähere Erläuterungen zu Menü-punkten oder Schaltflächen. Sie erscheinen, wenn ein Menüpunkt markiert oder eine Schaltfläche gedrückt wird. * Markieren Sie einen Menüpunkt und drücken Sie F1. Dies funktioniert für alle Menüs, ist jedoch der einzige Weg, um Hilfe zu Menüpunkten in einem Kontextmenü zu erhalten. Kontext-menüs erscheinen, wenn mit der rechten Maustaste geklickt wird. * Klicken Sie auf die Hilfe-Schaltfläche und anschließend auf einen beliebigen Menüpunkt, Schalter oder Bereich, um Hilfe zu dessen Zweck und Verwendung zu erhalten. * Dialogfenster haben ihren eigenen Hilfeschalter in der oberen rechten Ecke. Klicken Sie ihn an und klicken Sie anschließend auf einen beliebigen Teil des Dialogfensters, um Hilfe dazu zu erhalten. * Einige Dialogfenster haben zusätzlich zu dem kleinen Fragezeichen auch noch eine Hilfe-Schaltfläche. Klicken Sie diese an, um sich einen Überblick zur Verwendung des Dialogfensters anzeigen zu lassen. Symbole für Funktionstasten oder Tastenkombinationen auf dem Seitenrand dieses Handbuches teilen Ihnen mit, daß eine im Text erwähnte Funktion auch mit Hilfe der Tastatur aufgerufen werden kann. Im Referenzteil der Online-Hilfe finden Sie Übersichten aller Tastenkombinationen, Mauszeigerformen, Einstellungen und Sprachen sowie ein Glossar. Was ist neu im Vergleich zu Version 4.0? Erkennung * Maximale Genauigkeit durch Verwendung von zwei Erkennungs-Engines für die elf wichtigsten Sprachen. Die beiden OCR-Engines lesen den Text parallel zueinander unter Verwendung von Wörterbüchern. Die Erkennungsergebnisse werden miteinander verglichen, was zu einer Steigerung der Genauigkeit führt, vor allem bei Dokumenten schlechter Qualität. * Sie haben die Wahl zwischen sechs Erkennungsstufen, von der schnellsten bis zur genauesten: mit ein-, zwei- oder dreistufigem Lesevorgang, mit oder ohne Unterstützung einer Sprachanalyse und mit einer oder zwei Erkennungs- Engines. * Eine neue, OCR-spezifische Ausrichtungsmethode führt zu noch höherer Genauigkeit. Bildverwaltung * Es können jetzt auch Graustufen- und Farbbilder eingescannt, angezeigt, gedruckt und exportiert werden. Graphikzonen in Ausgabedokumenten können auch Farbbilder enthalten. Verschiedene Bildtypen (schwarzweiß, grau, farbig) können in einer einzigen, mehrseitigen Bilddatei gespeichert werden. * Mit Hilfe einer neuen Vorschaufunktion können die Bilder leichter überschaut und durchsucht werden. * Das Programm enthält Caere's SanManager 4.0, wodurch noch mehr Scanner unterstützt werden. Sprachen * Erstmals wird auch das kyrillische Alphabet unterstützt, wodurch zehn neue Sprachen hinzukommen: Belorussisch, Bulgarisch, Kabardisch, Mazedonisch, Moldawisch, Ossetisch, Russisch (mit Wörterbuch), Serbisch, Tschetschenisch und Ukrainisch. * Die Sprachenliste kann angepaßt werden. Standardmäßig werden alle Sprachen mit Wörterbuchunterstützung angezeigt. Es kann jedoch eine zweite Liste mit allen 114 Sprachen aufgerufen werden. Mit Hilfe dieser Liste können Sie Sprachen hinzufügen, löschen oder umordnen. Kontrolle und Nachbearbeitung * Das statische Lupenfenster kann durch ein dynamisches ersetzt werden, das stets geöffnet bleibt und einen Bildausschnitt entsprechend der aktuellen Textposition anzeigt. * Der Seite-an-Seite Bildvergleich heißt jetzt Bildfenstervergleich. * Die Suchfunktion kann so eingestellt werden, daß nur ganze Wörter gefunden werden. * Das Dezimaltrennzeichen in Tabellen kann vom Benutzer gewählt werden. Verarbeitung * Wurde die Verarbeitung angehalten, kann die Funktion "Stop zum Zoneneinrichten" an- und ausgeschaltet werden, so daß Sie die Art der Zoneneinrichtung auch mitten in der Verarbeitung eines Dokuments ändern können. * Mit Hilfe einer neuen Zwei-Seiten-Schablone wird die Verarbeitung zweiseitiger Formulare oder von Büchern vereinfacht. * Die Funktion "Zustand der letzten Speicherung wiederherstellen" ist über das Kontextmenü für einzelne Seiten verfügbar, erscheint jetzt aber auch im Hauptmenü, wo sie für das gesamte Dokument gilt. * Verbesserte Exportfunktion zur Weitergabe von erkannten Texten an MS Word 97. Bessere Unterstützung für Sehbehinderte Braille-Erkennung Als Standardzonentyp für das gesamte Dokument kann jetzt auch Braille eingestellt werden. Bei der Zonenanalyse wird in diesem Fall für jede Seite eine einzelne Lesezone eingerichtet. Zonen können auch von Hand eingezeichnet werden, müssen aber alle Braille-Zonen sein. Eine Beschränkung auf Ziffern ist dabei möglich. Als Ergebnis erhalten Sie einen Text, der dem Inhalt des Braille-Textes entspricht. Allgemeine Änderungen Text-, Bild- und Browser-Fenster können mit Strg+1, Strg+2 bzw. Strg+3 maximiert werden. Mit Strg+4 wird die Originalgröße des aktuellen Fensters wieder hergestellt. Der Fokus kann mit Hilfe von F6 zwischen den Fenstern bewegt werden. Zwischen der Browser-Liste und den Browser-Seiten kann mit Hilfe von Tab umgeschaltet werden. Ist in der Browser-Liste eine einzelne Seite markiert, können Sie mit F2 Text in das Notizenfeld eingeben. Die vorgeschlagenen Zeichen im Trainings-Dialogfenster können jetzt auch markiert werden, so daß sie mit Hilfe einer Sprachausgabe vorgelesen werden können. Direktverbindungen können über Shortcuts aufgerufen werden. Spezifische Änderungen Die folgenden Änderungen können durch Aufruf von Recognita Plus mit der Option /blind bewirkt werden: Im Dialogfenster Ansicht/Spalten werden statt Ankreuzungen Ja/Nein-Felder angezeigt. In allen Eingabefeldern wird die aktuelle Windows-Kodeseite verwendet, nicht der Recognita Fixed Font. Der sechsstufige Geschwindigkeit-/Genauigkeitsregler im Dialogfenster Optionen/ Genauigkeit wird ersetzt durch eine Auswahlliste. Dadurch können alle Steuerelemente mit Hilfe eines Screen Readers verwendet werden. Produkt-Support Bitte lassen Sie Ihr Exemplar von Recognita Plus registrieren, um den Produkt- Support in Anspruch nehmen zu können. Falls Sie irgendwelche Fragen zu Recognita Plus haben, auf die Sie in diesem Handbuch oder in der Elektronischen Online-Hilfe keine Antwort finden, können Sie an folgenden Stellen Hilfe erhalten: Internet Homepage Auf unserer Homepage finden Sie Informationen zu anderen Recognita-Produkten und Updates, Hinweise zur Behebung von Fehlern sowie Antworten auf häufig gestellte Fragen (Frequently Asked Questions, FAQ). Zugriff auf die Homepage erhalten Sie: * vom Hilfe-Menü aus * über www.caere.com/recognita Sie können Ihre technischen Fragen über unsere Internet Hompage stellen. Telefondienst Sie können unsere Technische Supportabteilung unter folgenden Nummern telefonisch oder per Fax erreichen: * Fax: (+36 1) 452-3710 * Tel.: (+36 1) 452-3706 Unsere Technische Supportabteilung ist gern dazu bereit, Ihre Fragen zu beantworten und Ihnen die Unterstützung zu geben, die Sie benötigen, um das Beste aus Ihrem Recognita Plus zu machen. Haben Sie bei einem Anruf bitte folgendes zur Hand: * Recognita Plus Versions- und Registriernummer * Hersteller und Modellbezeichnung Ihres Scanners * Namen und Versionsnummern anderer Programme, die Sie mit Ihrem Scanner benutzen * Hauptspeichermenge (RAM) in Ihrem System * freie Festplattenkapazität auf Ihrem Windows-Laufwerk * freie Festplattenkapazität auf dem Laufwerk, auf dem Ihre temporären Dateien gespeichert werden. Um die aktuellen Systemeinstellungen einschließlich des temporären Verzeichnisses anzuzeigen, müssen Sie an der Eingabeaufforderung SET eingeben und Enter drücken. Hinter dem Schlüsselwort TEMP steht der Name des temporären Verzeichnisses. Wieviel Speicherplatz auf einer Festplatte noch frei ist, wird auf der Statuszeile des Windows Explorer’s angezeigt. Markieren Sie dazu den Laufwerksbuchstaben des jeweiligen Laufwerks. * Sollte es bei Ihrer Arbeit mit Recognita Plus zu einem Fehler kommen: - Protokollieren Sie alle Fehlermeldungen. - Notieren Sie sich die Schritte, mit denen der Fehler reproduziert werden kann. - Falls möglich, speichern Sie das Zonenmuster in einer Schablonendatei, die Sie uns zusammen mit dem bzw. den Problembildern schicken können. * Wenn Sie sich per Telefon melden, starten Sie bitte, falls möglich, Recognita Plus vor Ihrem Anruf. Kapitel 3 Verarbeiten von Dokumenten In diesem Kapitel finden Sie Informationen zur Verarbeitung Ihrer Dokumente mit Recognita Plus. Es gibt verschiedene Weisen, um ein Dokument einzuscannen, zu erkennen, zu korrigieren und zu speichern. Je nach Qualität und Anzahl der zu verarbeitenden Seiten, der Zeit, die Ihnen für die Verarbeitung zur Verfügung steht, der benötigten Genauigkeit und der Nachbearbeitungsmethode Ihrer Wahl stehen Ihnen viele Möglichkeiten offen. Sie können die Verarbeitung entweder Schritt für Schritt steuern oder sich für eine vollautomatische Verarbeitung entscheiden. In diesem Kapitel finden Sie Informationen zu folgenden Themen: * Überblick über die Verarbeitung * Erstellen von Dokumenten * Unterbrechen und Fortsetzen der Verarbeitung * Erkennen von Bildern in einem Dokument * Arbeiten mit Dokumenten * Speichern von Dokumenten, Text und Bildern * Starten der Erkennung aus anderen Anwendungen heraus * Verarbeiten und Speichern ohne Anzeige Überblick über die Verarbeitung Die folgende Abbildung stellt die wesentlichen Arbeitsschritte von Recognita Plus dar. An den angezeigten Stellen hält die Verarbeitung an (oder kann unterbrochen werden), und das Programm bietet verschiedene Eingriffsmöglichkeiten. Es ist zum Beispiel möglich, bereits eingelesene Bilder mit veränderten Einstellungen noch einmal einzulesen. Sie können den aktuellen Stand eines Dokuments jederzeit in einer Recognita-Dokumentdatei speichern. Solche Dateien bilden die Grundlage für eine Aufgeschobene Verarbeitung. Zusätzlich zu den oben abgebildeten Möglichkeiten bietet Ihnen Recognita Plus die einzigartige Funktion Speichern ohne Anzeige. Mit Hilfe dieser Funktion können gescannte Seiten oder Bilddateien vollautomatisch verarbeitet und die Ergebnisse (Bilder, Text oder Recognita-Dokumente) ohne Benutzereingriff in mehreren Dateien abgespeichert werden. Erstellen von Dokumenten Die Arbeitsfolgen zum Einlesen von Bilddateien können Sie am besten mit den mitgelieferten Beispieldateien ausprobieren. Um gedruckte Dokumente einzuscannen, wählen Sie bitte einige aus und halten Sie sie griffbereit. Bitte beachten Sie, daß es keine leeren Recognita-Dokumente gibt. Ein neues Dokument wird automatisch beim Scannen von gedruckten Materialien oder beim Laden von Bilddateien angelegt. Die Bilder werden dabei im allgemeinen in ein Recognita-Dokument eingebettet; Bilddateien können jedoch auch über Datei- und Pfadnamen mit dem Dokument verknüpft werden. Es gibt zwei grundsätzliche Methoden zum Scannen bzw. Laden von Bildern: * Scannen/Laden und Erkennen. Diese Methode führt zu einem Dokument mit Bildern und Text. * Nur Scannen/Laden. Diese Methode führt zu einem Dokument, das lediglich Bilder enthält. Die Erkennung kann später durchgeführt werden. Wird bei Beginn einer neuen Verarbeitung bereits ein geöffnetes Dokument angezeigt, erscheint das Dialogfenster "Nächstes Dokument": - Wählen Sie eine der ersten beiden Optionen, falls Sie die neuen Seiten an das aktive Dokument anhängen möchten. - Wählen Sie eine der anderen beiden Optionen, falls Sie ein neues Dokument anlegen möchten. Falls Sie die letzte Option wählen, wird das Optionen- Dialogfenster erscheinen, mit dessen Hilfe Sie die neuen Einstellungen vornehmen können. Laden (und optional Erkennen) von Bilddateien: 1. Falls Sie die Verarbeitung mit Hilfe der Symbolleiste starten möchten, sollten Sie darauf achten, daß als Bildquelle Datei und nicht Scanner eingestellt ist. Sie können zwischen diesen beiden Möglichkeiten umschalten, indem Sie die ganz links auf der Hauptsymbolleiste stehende Schaltfläche anklicken. 2. Beginnen Sie mit dem Laden von Bilddateien mit oder ohne Erkennung. Mit Erkennung: - Achten Sie darauf, daß die Verarbeitungsschaltfläche so aussieht, wie links abgebildet, und klicken Sie sie an oder - Wählen Sie Lesen>von Datei aus dem Menü Verarbeiten. Ohne Erkennung: - Achten Sie darauf, daß die Verarbeitungsschaltfläche so aussieht, wie links abgebildet, und klicken Sie sie an oder - Wählen Sie Scannen>von Datei aus dem Menü Verarbeiten. Es erscheint das Dialogfenster zum Öffnen von Dateien. Im Fenster wird der zuletzt benutzte Ordner angezeigt. Markieren Sie die Dateien, die Sie erkennen möchten. Es werden alle markierten Dateien und die Dateien aus der unteren Liste gelesen. Ist nur eine einzelne Datei markiert, können Sie auf Anzeigen... klicken, um sich eine Vorschau der Datei anzeigen zu lassen. Klicken Sie auf Hinzufügen, um die markierten Dateien in die untere Liste aufzunehmen: * Um Dateien aus verschiedenen Ordnern zu verarbeiten. * Um die Dateien in einer bestimmten Reihenfolge zu lesen. 3. Klicken Sie auf OK, um mit der Verarbeitung der Dateien zu beginnen. Die dabei gemachten Fortschritte werden in der Statuszeile angezeigt. Falls Erkennung gewählt wurde, wird in einem Überblicksfenster angezeigt, wie weit die OCR auf der aktuellen Seite fortgeschritten ist. 4. Im Anschluß an die Verarbeitung wird die erste verarbeitete Seite angezeigt. Scannen (und optional Erkennen) gedruckter Dokumente: 1. Falls Sie die Verarbeitung mit Hilfe der Symbolleiste starten möchten, sollten Sie darauf achten, daß als Bildquelle Scanner und nicht Datei eingestellt ist. Sie können zwischen diesen beiden Möglichkeiten umschalten, indem Sie die ganz links auf der Hauptsymbolleiste stehende Schaltfläche anklicken. 2. Legen Sie die zu scannende(n) Seite(n) in Ihren Scanner ein. Falls Sie einen Automatischen Seiteneinzug (ADF) an Ihren Scanner angeschlossen haben, können sie mehrere Seiten auf einmal einscannen. 3. Beginnen Sie mit dem Scannen mit oder ohne Erkennung. Mit Erkennung: - Achten Sie darauf, daß die Verarbeitungsschaltfläche so aussieht, wie links abgebildet, und klicken Sie sie an oder - Wählen Sie Lesen>vom Scanner aus dem Menü Verarbeiten. Ohne Erkennung: - Achten Sie darauf, daß die Verarbeitungsschaltfläche so aussieht, wie links abgebildet und klicken Sie sie an oder - Wählen Sie Scannen>vom Scanner aus dem Menü Verarbeiten. 4. Warten Sie, bis alle Seiten gescannt und verarbeitet sind. Die dabei gemachten Fortschritte werden in der Statuszeile angezeigt. Falls Erkennung gewählt wurde, wird in einem Überblicksfenster angezeigt, wie weit die OCR auf der aktuellen Seite fortgeschritten ist. 5. Sobald alle Seiten eingescannt wurden, erscheint ein Dialogfenster, das Sie fragt, ob Sie noch weitere Seiten einlesen möchten. Wählen Sie JA, falls Sie noch weitere Seiten in dasselbe Dokument einscannen möchten oder NEIN, falls Sie die Verarbeitung beenden möchten. Legen Sie die neuen Seiten ein, bevor Sie auf JA klicken. 6. Im Anschluß an die Verarbeitung wird die erste verarbeitete Seite angezeigt. Unterbrechen und Fortsetzen der Verarbeitung Beim Verarbeiten eines mehrseitigen Dokuments haben Sie die Möglichkeit, das Programm anhalten zu lassen, um die Zonen zu überprüfen, zu verändern oder neue einzuzeichnen. Sobald die Erkennung unterbrochen wird, zeigt das Programm die Graphik der momentan verarbeiteten Seite an. Sie können die angezeigten Zonen verändern oder neue einzeichnen und alle zur Verfügung stehenden Einstellungen ändern. Nachdem Sie die Zonen überprüft, verändert oder ergänzt haben, können Sie die Verarbeitung noch einmal starten oder den gesamten Vorgang abbrechen, wodurch die letzte Seite unerkannt bleibt. Ausführlichere Informationen zur Zoneneinrichtung finden Sie in den Themen "Arbeiten mit Zonen" und "Arbeiten mit Tabellenzonen" in Kapitel 4. So veranlassen Sie das Programm, nach jeder gescannten/ geladenen Seite anzuhalten: - Klicken Sie auf Stop zum Zoneneinrichten auf der Haupt-symbolleiste oder - Wählen Sie Stop zum Zoneneinrichten aus dem Menü Verarbeiten. Anhalten der Verarbeitung während der Erkennung: - Klicken Sie auf Unterbrechen auf der Hautpsymbolleiste (nur während der Erkennung verfügbar). Der Zustand dieser Option kann verändert werden, wenn die Verarbeitung angehalten wurde. Wiederaufnahme der Verarbeitung: - Klicken Sie auf Fortfahren auf der Hautpsymbolleiste (nur bei Unterbrechungen verfügbar) oder - Wählen Sie Fortfahren aus dem Menü Verarbeiten. Abbruch der Verarbeitung: - Klicken Sie auf Stop auf der Hautpsymbolleiste (nur bei Unterbrechungen verfügbar) oder - Wählen Sie Stop aus dem Menü Verarbeiten. Alle bereits zuvor eingelesenen Seiten bleiben erhalten; die aktuelle Seite wird nicht erkannt, ihre Graphik bleibt jedoch erhalten. Es werden keine weiteren Seiten verarbeitet. Erkennen von Bildern in einem Dokument Einige Gründe, warum die Bilder in einem Recognita-Dokument (erneut) erkannt werden müssen: * Sie wurden ursprünglich ohne Erkennung geladen, da die Zonen manuell eingerichtet werden mußten. * Die Erkennung war aufgrund falscher Einstellungen (z.B. Sprache, Wörterbuch, Helligkeit usw.) nicht befriedigend. * Die Erkennungsergebnisse sind aufgrund ungeeigneter Zonenpositionen oder inkorrekter Seitenlage falsch. Folgende Dinge können (erneut) erkannt werden: * Die Graphik der aktuellen Seite * Alle Seitengraphiken * Alle noch nicht erkannten Seitengraphiken * Graphiken markierter Seiten Erkennung der Graphik der aktuellen Seite: - Achten Sie darauf, daß die Schaltfläche auf der Symbolleiste so aussieht, wie hier abgebildet, und klicken Sie sie an oder - Wählen Sie Erkennen>Diese Seite aus dem Kontextmenü des Bildfensters. Erkennung aller Seitengraphiken: - Achten Sie darauf, daß die Schaltfläche auf der Symbolleiste so aussieht, wie hier abgebildet, und klicken Sie sie an oder - Wählen Sie Erkennen>Alle Seiten aus dem Kontextmenü des Bildfensters. Erkennung der noch nicht erkannten Seitengraphiken: - Achten Sie darauf, daß die Schaltfläche auf der Symbolleiste so aussieht, wie hier abgebildet, und klicken Sie sie an oder - Wählen Sie Erkennen>Nicht erkannte Seiten aus dem Kontextmenü des Bildfensters. Erkennung der Graphiken aller markierten Seiten: 1. Markieren Sie die zu erkennenden Seiten in der Browser-Liste. 2. Wählen Sie Seiten erkennen aus dem Kontextmenü des Browser. Arbeiten mit Dokumenten Nachdem ein Dokument angelegt wurde, können Sie es je nach dessen Inhalten, Ihren Zielen und Arbeitsmethoden auf verschiedene Weisen weiterverarbeiten. In diesem Abschnitt erhalten Sie einen Überblick über diese Möglichkeiten. Ausgabe erzeugen (siehe später in diesem Kapitel): * Speichern oder Senden des Dokuments. Sie können es später wieder öffnen und weiter bearbeiten. * Speichern oder Senden eines Teils oder des gesamten erkannten Textes in einem beliebigen Format. * Speichern oder Senden einiger oder aller Bilder in einem beliebigen Format. * Export von Text und/oder Graphiken in andere Anwendungen mit Hilfe von Drag-and-Drop. * Drucken von Text und/oder Bildern. Überprüfen des erkannten Textes (siehe Kapitel 4): * Manuelle Überprüfung und Bearbeitung des Textes. * Nachbearbeitungsfunktion für die Suche nach Problemstellen. * Trainieren von Zeichen (falls notwendig). Zoneneinrichtung für eine erneute Erkennung (siehe Kapitel 4): * Überprüfen der automatischen Zonen und eventuelle Korrekturen. * Einzeichnen der Zonen von Hand. * Laden von Zonenschablonen. Erkennung von Bildern (siehe vorhergehenden Abschnitt in diesem Kapitel): * Erkennen einiger oder aller Bilder eines Dokuments. Hinzufügen neuer Seiten (siehe ersten Abschnitt in diesem Kapitel): * Hinzufügen neuer Seiten an einer beliebigen Stelle im Dokument. Dieses Handbuch enthält ein separates Kapitel "Arbeiten mit Dokumenten", das näher auf einige dieser Themen eingeht. In der Online-Hilfe finden Sie ebenfalls ausführliche Informationen hierzu. Speichern von Dokumenten, Text und Bildern Nachdem ein Dokument erstellt wurde, können Sie dessen Text und Bilder speichern, oder Sie können das gesamte Dokument in einer Recognita- Dokumentdatei abspeichern. Sie können Texte, Bilder oder Recognita-Dokumente auch per e-mail verschicken. In diesem Abschnitt finden Sie Hinweise zu folgenden Themen: * Speichern und Senden von Dokumenten * Speichern und Senden von Text * Zusätzliche Einstellungen bei der Textausgabe * Speichern und Senden von Bildern * Benutzung von Drag-and-Drop und der Zwischenablage Speichern und Senden von Dokumenten Sie können Ihre Recognita-Dokumente jederzeit als Dokumentdateien (auch RCD- Dateien genannt) abspeichern. Dadurch stehen die Dokumente auch bei späteren Programmsitzungen mit allen Möglichkeiten zur Nachbearbeitung und zum Training zur Verfügung. Sie können Ihre RCD-Dateien auch als e-mail verschicken. Speichern eines Dokuments: 1. Klicken Sie auf die Schaltfläche "Recognita-Dokument speichern" auf der Hauptsymbolleiste oder wählen Sie Als Recognita-Dokument speichern aus dem Menü Datei. Beim ersten Speichern eines Dokuments erscheint das Dialogfenster "Als Recognita-Dokument speichern". Wählen sie einen Ordner, geben Sie der RCD-Datei einen Namen und klicken Sie auf Speichern. 2. Während Ihrer Arbeit sollten Sie in regelmäßigen Abständen auf die Schaltfläche Recognita-Dokument speichern klicken, um die vorgenommenen Änderungen zu schützen. Der erkannte Text kann jederzeit wieder in den Zustand vor der letzten Speicherung überführt werden. Wiederherstellen des Zustands vor der letzten Speicherung: 1. Markieren Sie diejenigen Seiten in der Browser-Liste, deren Text wiederhergestellt werden soll. 2. Wählen Sie Letzten Stand wiederherstellen aus dem Kontextmenü des Browser’s. 3 Um das gesamte Dokument wiederherzustellen, benutzen Sie den entsprechenden Befehl aus dem Datei-Menü. Senden eines Dokuments als Mail-Anhang: - Wählen Sie Senden>Recognita-Dokument aus dem Menü Datei. Ihr Mail- Programm wird aufgerufen und erscheint mit einer neuen, leeren Nachricht, die das aktuelle Dokument als Anhang enthält. Speichern und Senden von Text Im Anschluß an die Erkennung enthält Ihr Recognita-Dokument erkannten Text. Sie können diesen in vielen verschiedenen Formaten abspeichern oder versenden. Die von Recognita Plus unterstützten Formate finden Sie in der Formatliste in den Dialogfenstern "Text speichern" und "Text senden". Die Ausgabeformate können in vier Gruppen unterteilt werden: * Reine Textformate. Hierzu gehören die verschiedenen GWP- und ASCII- Formate, die sich hauptsächlich darin unterscheiden, wie die Originalformatierungen durch Zeilenumbrüche, Tabulatoren und Leerzeichen wiedergegeben werden. * Tabellen- und Tabellenkalkulations-kompatible Formate. Dazu gehören die durch Tabulatoren, Kommas oder Anführungszeichen separierten ASCII-Formate sowie Formate für die am weitesten verbreiteten Tabellenkalkulationsprogramme. * Textverarbeitungsformate, in die Recognita Plus den Text unter Beibehaltung des Original-Seitenlayouts und mit Graphiken abspeichern kann. * Textverarbeitungsformate, in die Recognita Plus den Text unter Beibehaltung des Original-Seitenlayouts aber ohne Graphiken abspeichern kann. Wenn Sie Ihre Textverarbeitung, Tabellenkalkulation oder Ihr DTP-Programm kennen, werden Sie wissen, welches Format sich am besten dafür eignet. Speichern des erkannten Textes: 1. Wählen Sie Text speichern unter aus dem Menü Datei oder Text speichern aus dem Kontextmenü des Browser’s. Es erscheint das Dialogfenster "Text(e) speichern". 2. Wählen Sie ein Ausgabeformat aus der Formatliste. 3. Stellen Sie, falls notwendig, Weitere Optionen ein (siehe nächster Abschnitt). 4. Wählen Sie einen Ordner, geben Sie einen Dateinamen ein und klicken Sie auf OK. Senden des erkannten Textes als Mail-Anhang: 1. Wählen Sie Senden>Text aus dem Menü Datei. Es erscheint das Dialogfenster "Text senden". 2. Wählen Sie ein Ausgabeformat aus der Formatliste. 3. Die Option Weiteres steht auch beim Senden zur Verfügung (siehe nächster Abschnitt). 4. Klicken Sie auf OK. Ihr Mail-Programm wird gestartet und zeigt eine neue Nachricht mit dem Text als Anhang an. Zusätzliche Einstellungen bei der Textausgabe Zusätzlich zur Einstellung eines geeigneten Ausgabeformats haben Sie zahlreiche Möglichkeiten, die Formatierung Ihres Textdokuments zu beeinflussen. Klicken Sie beim Speichern oder Senden auf Weiteres, um sich das Dialogfenster "Weitere Einstellungen für Speicherung" anzeigen zu lassen. Als erstes sollten Sie einen der drei Formatierungsmodi wählen, die mit den drei Ansichten im eingebauten Editor von Recognita Plus übereinstimmen. Die verfügbaren Formatierungen sind: * Volle Formatierung: das Original-Seitenlayout wird beibehalten; formatierter Text und Graphiken werden in Rahmen angeordnet. * Teilweise Formatierung: Zeichen- und Absatzformatierungen werden beibehalten, Spalten werden aneinander angehängt. * Ohne Formatierung: Text wird ohne Formatierungen übernommen. Falls möglich, werden Spalten aneinander angehängt. Jeder der drei Formatierungsmodi hat seinen eigenen Satz gespeicherter Einstellungen für die Dokument-, Absatz- und Zeichenformatierung. Obwohl in den meisten Fällen Standardwerte verwendet werden können, kann es doch einmal von Nutzen sein, die Werte von Hand anzupassen. Bei der Vollen Formatierung sind viele Einstellungen immer auf Auto gestellt, bei Ohne Formatierung stehen viele von ihnen nicht zur Verfügung. Die Teilweise Formatierung eignet sich daher am besten zur Einstellung individueller Werte. Standardmäßig werden beim Speichern und Senden bestimmte Seiten angeboten. Auf dem Reiter Allgemeines können Sie jedoch auch andere Seiten einstellen. * Wenn Sie die Speicherung aus dem Menü Datei aufrufen, werden alle Seiten angeboten. * Wenn Sie das Kontextmenü benutzen, werden die momentan markierten Seiten angeboten. Sie können jede Seite in einer separaten Datei abspeichern lassen, indem Sie die Option "Eine Datei pro Seite" auf dem Reiter Allgemeines aktivieren. Speichern und Senden von Bildern Gescannte Bilder werden stets in die Recognita-Dokumentdatei eingebunden; Bilddateien können wahlweise eingebettet oder über ihren Dateinamen verknüpft werden, um sie nicht doppelt auf der Festplatte zu haben. Diese Option kann auf dem Reiter Bilder im Optionen-Dialogfenster eingestellt werden. In jedem Fall können Sie die Bilder jedoch in einem der unterstützten Dateiformate abspeichern oder als Mail-Anhang verschicken. Sie können einseitige oder mehrseitige Schwarzweiß-, Graustufen- oder Farbbilder erzeugen. Die möglichen Kombinationen finden Sie in einer Tabelle in der Online-Hilfe. Speichern von Seitengraphiken: 1. Wählen Sie Bild speichern unter aus dem Menü Datei oder Bild speichern aus dem Kontextmenü des Browser’s. Es erscheint das Dialogfenster "Bild(er) speichern". 2. Wählen Sie ein Ausgabeformat aus der Formatliste. 3. Klicken Sie auf Weiteres>>/Reduzieren<<, falls Sie die Option für Graustufenbilder, die zu speichernden Seiten oder die Option "Eine Datei pro Seite" einstellen möchten. 4. Wählen Sie einen Ordner, geben Sie einen Dateinamen ein und klicken Sie auf OK. Senden von Seitengraphiken als Mail-Anhang: 1. Wählen Sie Senden>Bild aus dem Menü Datei. Es erscheint das Dialogfenster "Bild senden". 2. Wählen Sie ein Ausgabeformat aus der Formatliste. 3. Alle Weiteren Einstellungen mit Ausnahme von "Eine Datei pro Seite" stehen ebenfalls zur Verfügung. 4. Klicken Sie auf OK. Ihr Mail-Programm wird gestartet und zeigt eine neue Nachricht mit dem Bild als Anhang an. Falls Sie mehr als eine Seite eingestellt haben, werden die Seiten alle in einer mehrseitigen Bilddatei abgespeichert. Falls Sie ein einseitiges Format gewählt haben, müssen Sie alle Seiten einzeln abschicken. Standardmäßig werden für das Speichern und Senden bestimmte Seiten angeboten. Sie können in beiden Dialogfenstern andere Seiten einstellen. * Wenn Sie die Speicherung aus dem Menü Datei aufrufen, werden alle Seiten angeboten. * Wenn Sie das Kontextmenü benutzen, werden die momentan markierten Seiten angeboten. Benutzung von Drag-and-Drop und der Zwischenablage Sie können bestimmte Teile eines Recognita-Dokuments markieren, um sie anschließend mit Hilfe von Drag-and-Drop oder über die Zwischenablage zu kopieren. Im Textfenster können folgende Dinge markiert werden: * Ein Teil des Textes, der innerhalb einer Zone erkannt wurde. Markieren Sie den Text wie in anderen Programmen auch. * Der gesamte Text der aktuellen Seite. Benutzen Sie Seite markieren aus dem Kontextmenü des Textfensters oder aus dem Bearbeiten-Menü. * Der gesamte Text des Dokuments. Wählen Sie Alle Seiten markieren aus dem Bearbeiten-Menü. * Eingerahmte Graphiken im Textfenster. Doppelklicken Sie einen Rahmen mit Graphik, um diese zu markieren. Sie sollten dazu vorher in die Volle Formatierung umschalten. (Siehe Abschnitt "Bearbeitung" zu den drei Ansichtsmodi im Editor.) Im Bildfenster können Sie jede beliebige Zone durch einen Doppelklick markieren. Der Inhalt der markierten Zone wird als Graphik übertragen. Starten der Erkennung aus anderen Anwendungen heraus Recognita Plus kann auf verschiedene Weisen in Ihr Computersystem integriert werden. Folgende Methoden stehen zur Verfügung: * Direktverbindungen zu anderen Anwendungen * Erkennungsfunktionen in Mail-Programmen * Menüpunkte im Kontextmenü des Explorer’s * Drag-and-Drop aus dem Explorer heraus. Die ersten beiden Möglichkeiten können im Anschluß an die Installation oder später mit Hilfe des Maintenance Setup von Recognita Plus aktiviert werden. Die letzte Möglichkeit wird automatisch installiert. Direktverbindungen zu anderen Anwendungen Direktverbindungen können im Maintenance Setup eingerichtet werden und ermöglichen es Ihnen, Recognita Plus jederzeit mit Hilfe eines Symbols auf der Task-Leiste aufzurufen, während Sie in einer anderen Anwendung arbeiten. Der erkannte Text wird an der aktuellen Textposition eingefügt. Benutzung einer Direktverbindung: 1. Starten Sie Ihre Zielanwendung und setzen Sie die Textmarke an die Stelle, an der der erkannte Text eingefügt werden soll. 2. Klicken Sie auf das kleine Recognita-Plus-Symbol auf der Task-Leiste. Es erscheint ein Menü mit zwei Menüpunkten. 3. Wählen Sie aus diesem Menü Erkennen von Datei oder Erkennen vom Scanner. Falls Recognita Plus noch nicht läuft, wird es gestartet. 4. Die Erkennung wird entsprechend dem ausgewählten Menüpunkt durchgeführt. Das Fenster von Recognita Plus wird im unteren Teil des Bildschirms angezeigt. 5. Im Anschluß an die Erkennung wird der Text an der aktuellen Textposition eingefügt. Für die Textkonvertierung wird Teilweise Formatierung verwendet. Wenn Sie mit der rechten Maustaste auf das Symbol auf der Task-Leiste klicken, wird ein Menü angezeigt, mit dessen Hilfe Sie das Optionen- Dialogfenster von Recognita Plus aufrufen können. Ausführen der Erkennung im Hintergrund: 1. Verkleinern Sie Recognita Plus auf Symbolgröße, nachdem die Erkennung gestartet wurde. Die Seitenzahl der gerade verarbeiteten Seite wird auf dem Recognita-Symbol auf der Task-Leiste angezeigt. 2. Ein blinkendes Symbol zeigt an, daß die Erkennung beendet wurde. Klicken Sie auf das Symbol, um das Fenster von Recognita Plus wieder aufzurufen. 3. Es erscheint ein Meldungsfenster, das Sie dazu auffordert, die Einfügemarke an die gewünschte Stelle zu plazieren. 4. Erst nachdem Sie die Einfügemarke richtig plaziert haben, sollten Sie im Meldungsfenster auf OK klicken. Indem Sie die Erkennung im Hintergrund laufen lassen, können Sie in der Zwischenzeit an Ihrem Dokument weiterarbeiten. Sie können sogar ein neues Dokument anlegen, wenn Sie die Aufforderung zur Plazierung der Einfügemarke erhalten. Erkennungsfunktionen in Mail-Programmen Sie können mit Hilfe von Recognita Plus Bilddateien lesen, die als Anhänge von Nachrichten in Ihrem Mail-Programm eintreffen. Für diesen Zweck wird bei der Installation ein neues Untermenü, Recognita OCR, in das Menü Ihres Mail- Programmes eingefügt. Folgende Anwendungen werden unterstützt: * Microsoft Exchange * Microsoft Outlook * Lotus Notes Bei der Durchführung der Erkennung gibt es zwei Möglichkeiten: * Interaktives Lesen: Recognita Plus wird gestartet (falls notwendig); das Programm erkennt alle Anhänge und fügt die Ergebnisse in ein Recognita- Dokument ein, das Sie anschließend nachbearbeiten oder speichern können. * Nicht-interaktives Lesen: Das Programm läuft im Hintergrund und schickt die Ergebnisse der Erkennung als Anhänge im RTF-Format oder eingefügt in den Nachrichtentext zurück an das Mail-Programm. Ein Beispiel für das Menü Recognita OCR Tools: Menüpunkte im Kontextmenü des Explorers Falls im Explorer (oder auf dem Desktop) eine Datei vom Typ TIF, BMP, PCX oder AWD markiert wird, enthält das Kontextmenü einen zusätzlichen Menüpunkt Erkennen. Benutzung des Kontextmenüs im Explorer: 1. Markieren Sie im Explorer oder auf dem Desktop eine oder mehrere Bilddateien. 2. Wählen Sie Erkennen. Recognita Plus wird gestartet und zeigt das Optionen-Dialogfenster an. Ändern Sie diese nach Ihrem Bedarf. 3. Klicken Sie auf OK. Das Programm beginnt mit der Erkennung. Warten Sie, bis der Vorgang beendet ist. 4. Es erscheint das Dialogfenster "Text speichern", mit dem Sie den Text speichern können. Recognita Plus bleibt weiterhin aktiv. Drag-and-Drop aus dem Explorer heraus Sie können Bilddateien im Explorer markieren und mittels Drag-and-Drop auf das Symbol oder das Hauptfenster von Recognita Plus ziehen. Die Inhalte der Bilddateien werden erkannt, als ob sie aus dem Programm heraus geladen worden wären. Verarbeiten und Speichern ohne Anzeige Sie haben die Möglichkeit, Bilder zu scannen bzw. zu laden, ihren Inhalt zu verarbeiten und die Ergebnisse speichern zu lassen, ohne daß die Dokumente am Bildschirm angezeigt werden. Stattdessen werden sie in einer oder mehreren Dateien abgespeichert. Diese Arbeitsmethode wird Speichern ohne Anzeige genannt. Normalerweise wird sie nur beim Verarbeiten großer Seitenmengen verwendet. Es können dabei Bilder, Text oder ganze Recognita-Dokumente abgespeichert werden. Umschalten in den Modus "Speichern ohne Anzeige": - Wählen Sie Speichern ohne Anzeige aus dem Menü Verarbeiten. Die zwei normalen Ansichten der Schaltfläche Verarbeiten ändern sich und zeigen diesen speziellen Arbeitsmodus an. Das Symbol für die Erkennung ändert sich wie folgt: Das Symbol für Scannen ohne Erkennung ändert sich wie folgt: Um den Modus abzuschalten, wählen Sie erneut den Menüpunkt. Benutzung von "Speichern ohne Anzeige": 1. Schalten Sie wie beschrieben in diesen Modus um. 2. Beginnen Sie ganz normal mit der Verarbeitung. Es erscheint ein Dialogfenster, das den Fenstern "Text speichern" bzw. "Bild speichern" ähnelt. Wichtig: in diesem Dialogfenster stellen Sie Optionen für die Speicherung ein! Verwechseln Sie dieses Fenster nicht mit dem Dialogfenster "Datei(en) öffnen". Dieses wird beim Laden von Bilddateien anschließend angezeigt. 3. Wählen Sie einen Zielordner, geben Sie den Ausgabedateien Namen und nehmen Sie alle anderen Einstellungen vor. - Falls Sie die Verarbeitung mit Erkennung durchführen, können Sie ein Textformat oder Recognita-Dokument wählen. - Falls Sie die Verarbeitung ohne Erkennung durchführen, können Sie ein Bildformat oder Recognita-Dokument wählen. 4. Falls Sie die gescannten Seiten auf mehrere Dateien verteilen möchten, klicken Sie auf Optionen und bestimmen Sie auf dem Reiter Dokument die Bedingungen zum Start eines neuen Dokuments sowie andere Einstellungen. 5. Klicken Sie auf OK. Falls Sie Bilddateien verarbeiten möchten, erscheint anschließend das Dialogfenster "Datei(en) öffnen". Die Ausgabedateien werden entsprechend der vorgenommenen Einstellungen automatisch erzeugt. Die Ausgabedateien erhalten den vorgegebenen Dateinamen sowie eine vierstellige fortlaufende Zahl. Standardmäßig wird mit 0001 begonnen, Sie können jedoch nach dem Dateinamen in eckigen Klammern eine andere Zahl eingeben. Die führenden Nullen können dabei weggelassen werden. Um die Numerierung zum Beispiel bei 200 starten zu lassen, geben Sie den Dateinamen wie folgt ein: beispiel[200] Beim Speichern wird an den Dateinamen automatisch die Erweiterung des gewählten Dateityps angehängt. Kapitel 4 Arbeiten mit Dokumenten Recognita Plus bietet Ihnen viele Funktionen zur Weiterverarbeitung der erzeugten Dokumente. Welche dieser Möglichkeiten Sie benutzen und ob Sie sie überhaupt nutzen, hängt von Ihnen und der Komplexität der zu erledigenden Aufgaben ab. In diesem Kapitel finden Sie Informationen zu folgenden Themen: * Arbeiten mit Zonen * Arbeiten mit Tabellenzonen * Korrigieren des Textes * Navigieren in Recognita-Dokumenten * Benutzung der Zeichensatztabelle Arbeiten mit Zonen Zonen sind rechteckige Bereiche, die gedruckte Elemente eines Bildes umschließen. Sie enthalten die einzelnen Teile einer Seite, die als Text oder etwas anderes erkannt oder als Graphik beibehalten werden können. Alle Bereiche der Seite, die sich nicht in einer Zone befinden, werden während der Erkennung ignoriert. Zonen und ihre Lesereihenfolge werden im Bildfenster angezeigt. Eine der Zonen ist stets die aktive Zone. Diese hat Griffe an ihren Ecken und auf jeder Seite, mit deren Hilfe Sie die Größe der Zone verändern können. Um eine Zone zur aktiven Zone zu machen, müssen Sie sie nur anklicken. Nach dem Scannen bzw. Laden eines Bildes analysiert das Programm das Seitenlayout, findet dabei Textabschnitte und Graphiken und legt die Zonen an. Dabei entscheidet das Programm bereits auch über die Lesereihenfolge der Zonen. Zonen können auch von Hand eingezeichnet oder aus einer Zonenschablone geladen werden. Sie können jederzeit neue Zonen einzeichnen oder die bereits vorhandenen verändern. Insgesamt gibt es sechs verschiedene Zonentypen, die bestimmen, welche Erkennungsfunktion für die einzelnen Zonen benutzt werden (normalerweise ist dies die Omnifont-Funktion). Bei Textzonen wird zusätzlich noch zwischen Fließtext und Tabellen sowie zwischen Sprachauswahl (gesamtes Alphabet) und Nur Zahlen unterschieden. Zusammengenommen bilden diese Unterscheidungen die Zoneneigenschaften. Dieser Abschnitt beschäftigt sich mit folgenden Themen zur Arbeit mit Zonen: * Automatische oder Manuelle Zoneneinrichtung * Grundlagen der Manuellen Zoneneinrichtung * Grundlagen der Zoneneigenschaften * Grundlagen der Zonenschablonen Automatische oder Manuelle Zoneneinrichtung Falls Sie nur einen bestimmten Teil einer Seite erkennen lassen möchten oder falls das Layout einer Seite sehr komplex ist und Sie vermuten oder feststellen, daß die automatische Layoutanalyse ungeeignete Ergebnisse liefert, können Sie diese abschalten. - Um die automatische Zoneneinrichtung abzuschalten, aktivieren Sie die Option Keine Layoutanalyse beim Scannen auf dem Reiter Vorverarbeitung im Optionen-Dialogfenster. Grundlagen der Manuellen Zoneneinrichtung Alle zur Zonenbearbeitung benötigten Funktionen finden Sie sowohl auf der Symbolleiste als auch im Kontextmenü des Bildfensters. In diesem Abschnitt wird die Zoneneinrichtung mit Hilfe der Symbolleiste beschrieben. Manuelle Erstellung von Zonen: - Klicken Sie auf das Bild und ziehen Sie mit dem erscheinenden Fadenkreuz einen rechteckigen Rahmen auf. Verändern und Verschieben von Zonen: Symbolleisten-Schaltflächen für die Zonenmanipulation: Verändern der Zonenreihenfolge: 1. Klicken Sie auf Zonen neu anordnen, um mit der Umordnung zu beginnen. 2. Klicken Sie auf die letzte, an richtiger Position stehende Zone und klicken Sie anschließend die restlichen Zonen in der gewünschten Lesereihenfolge an. Hören Sie auf, sobald alle Zonen die richtige Reihenfolge haben. 3. Klicken Sie erneut auf Zonen neu anordnen oder klicken Sie außerhalb einer Zone, um die Umordnung zu beenden. Mit Esc können Sie die Umordnung jederzeit abbrechen. Löschen einer einzelnen Zone: - Drücken Sie Entf, um die aktive Zone zu löschen. Um mehrere Zonen zu löschen: - Drücken Sie Strg+Entf, um die aktive Zone und alle ihr folgenden Zonen zu löschen. - Drücken Sie Strg+Umschalt+Entf, um die aktive Zone und alle vorhergehenden Zonen zu löschen. Grundlagen der Zoneneigenschaften Da sich die Standardeinstellungen für die meisten Erkennungsaufgaben eignen, müssen Sie die Zoneneigenschaften in den meisten Fällen nicht ändern. Zonen haben folgende Eigenschaften: * Eine der sechs Erkennungsfunktionen oder Graphik * Textfluß: Fließtext oder Tabelle, nur bei Omnifont-, Nadeldruck- und Handschriftzonen * Zugelassene Zeichen: Nur Zahlen oder Sprachauswahl (gesamtes Alphabet), nur für Omnifont-, Braille- und Nadeldruckzonen Die Eigenschaften einer Zone werden durch Symbole und die Rahmenfarbe symbolisiert. Um die Symbole anzeigen zu lassen, müssen Sie die Option Eigenschaften zeigen im Reiter Ansicht des Optionen-Dialogfensters aktivieren. Graphikzonen haben schwarze Rahmen, sind grau schraffiert und enthalten keine kleinen Symbole Unabhängig davon, ob die Zonen manuell oder automatisch eingerichtet werden, werden neuen Zonen stets automatisch bestimmte Zoneneigenschaften zugewiesen (siehe weiter unten in diesem Abschnitt). Sie können jedoch nachträglich alle Eigenschaften einer Zone ändern, falls Sie dies möchten. Auf der Optionen-Symbolleiste bzw. im Reiter Genauigkeit des Optionen- Dialogfensters können Sie einstellen, welche Zoneneigenschaften neuen Zonen in Zukunft standardmäßig zugeordnet werden sollen. Um die Eigenschaften einer Zone zu verändern, öffnen Sie am besten das Fenster Zoneneigenschaften oder benutzen Sie das Kontextmenü des Bildfensters. Die aktuellen Eigenschaften der aktiven Zone sind fett umrahmt. Klicken Sie auf eine beliebige andere Eigenschaft, um diese der aktiven Zone zuzuweisen. Zuweisung von Zoneneigenschaften durch das Programm: * Graphiken werden stets automatisch gefunden. * Erkennungsfunktion: - Automatisch bestimmten Zonen wird der Standardzonentyp zugewiesen. Steht dieser auf Automatisch, wird in Abhängigkeit vom Zoneninhalt entweder Omnifont, Nadeldruck, Handschrift (Zahlen) oder Strichkode zugewiesen. - Bei der manuellen Zoneneinrichtung werden die Einstellungen der aktiven Zone übernommen. Die als erste eingezeichnete Zone übernimmt die Standardeinstellungen bzw. Omnifont, falls Automatisch eingestellt ist. * Zugelassene Zeichen (gültig für Omnifont und Nadeldruck): - Automatisch erzeugte Zonen übernehmen die Standardeinstellung. - Manuell eingezeichnete Zonen übernehmen die Einstellung der aktiven Zone. * Fließtext und Tabellentext werden automatisch unterschieden. Um die automatische Tabellenbestimmung abzuschalten, halten Sie beim Einzeichnen einer Zone die Strg-Taste gedrückt. * Braille kann als Standardzonentyp für das gesamte Dokument eingestellt werden. Alle vorhandenen Zonen verwandeln sich dabei in Braille-Zonen mit roten Rahmen (Tabellen werden nicht unterstützt). Zonen können manuell eingezeichnet werden, müssen aber als Zonentyp Braille haben; die Option Sprachen/Nur Zahlen bleibt weiter verfügbar. Bei der automatischen Zonenanalyse wird für jede Seite eine einzelne Zone angelegt. Als Ergebnis erhalten Sie einen Text, der dem Inhalt des Braille-Textes entspricht. Eine Liste aller zum Einscannen von Braille-Texten geeigneten Scanner finden Sie in der Online-Hilfe. Grundlagen der Zonenschablonen Eine Zonenschablone ist eine Datei mit Informationen zu einem vordefinierten Satz von Zonen (Größe, Position, Eigenschaften und Lesereihenfolge) für eine einzelne Seite. Zonen können in einer Zonenschablone gespeichert und später jederzeit wieder geladen werden. Eine Schablone kann auch wieder aus dem Speicher entfernt werden, zum Beispiel wenn sie irrtümlich geladen wurde. Zonenschablonen sind vor allem dann von Nutzen, wenn Sie mehrere Seiten oder Dokumente mit derselben Seitenstruktur einlesen möchten. Wurde eine Schablone geladen, wird bei neu gescannten bzw. geladenen Seiten keine automatische Layoutanalyse durchgeführt. Das Programm korrigiert automatisch leichte Fehlausrichtungen der Zonenschablonen, die durch Verschiebungen beim Scannen entstehen können. Wenn Sie mit der rechten Maustaste auf das Schablonenfeld der Statuszeile klicken, erhalten Sie ein Kontextmenü mit Funktionen zum Laden, Speichern und Entfernen von Zonenschablonen. Erstellung einer Schablonendatei: 1. Zeichnen bzw. überprüfen Sie die Zonen und ihre Eigenschaften. 2. Wählen Sie Schablone>Speichern aus dem Menü Datei oder Speichern aus dem Kontextmenü. Es erscheint das Dialogfenster "Schablonen speichern". 3. Geben Sie einen Namen für die Schablone ein und klicken Sie auf Speichern. Laden einer Schablonendatei: 1. Wählen Sie Schablone>Laden aus dem Menü Datei oder Laden aus dem Kontextmenü. Es erscheint das Dialogfenster "Schablone laden". 2. Wählen Sie die zu ladende Schablonendatei und klicken Sie auf Laden. Falls gerade ein Dokument geöffnet ist, erscheint das Dialogfenster "Schablone anwenden": 3. Wählen Sie eine der drei Optionen, um die Schablone auf die gewünschten Seiten anzuwenden. Falls die Schablone für die aktuelle oder andere, bereits vorhandene Seiten geladen wird, werden alle vorhandenen Zonen gelöscht und anschließend die geladenen Zonen angezeigt. Wurde noch kein Dokument geöffnet, wird die geladene Schablone für alle neu hinzukommenden Seiten verwendet. Entfernen einer Schablone: 1. Wählen Sie Schablone>Keine Schablone aus dem Menü Datei oder Keine Schablone aus dem Kontextmenü. 2. Wird die Schablone aus einem geladenen Dokument entfernt, erscheint das Dialogfenster "Schablone entfernen": 3. Wählen Sie eine der beiden Optionen. Falls Sie sich für die erste entscheiden, werden alle Schablonenzonen auf allen Seiten des Dokuments, auf denen sie nicht verändert wurden, gelöscht. Um die Schablone nur von der aktuellen Zone zu entfernen, reicht es aus, alle Zonen zu löschen. Falls kein Dokument geöffnet ist, werden neu hinzukommende Seiten automatisch analysiert, falls diese Funktion nicht abgeschaltet wurde. Beginnend mit Version 5.0 gibt es auch zweiseitige Schablonen zur einfacheren Verarbeitung von zweiseitigen Formularen oder von Büchern. Zweiseitige Schablonen enthalten zwei Zonenmuster und wenden diese abwechselnd auf aufeinanderfolgende Seiten an. Um eine zweiseitge Schablone zu speichern, bereiten Sie die Zonen auf zwei aufeinanderfolgenden Seiten vor, machen die erste Seite zur aktiven Seite, wählen Sie Schablone speichern und aktivieren Sie die Optione Zwei Seiten. Arbeiten mit Tabellenzonen Bei der Layoutanalyse wird automatisch zwischen Fließtext und Tabellen unterschieden. Wird eine Tabelle entdeckt, so wird die Textgraphik mit einer Tabellenzone eingerahmt. Tabellen werden auch beim manuellen Einzeichnen von Zonen automatisch entdeckt, falls nicht gleichzeitig die Strg-Taste gedrückt wird. Tabellen erkennen Sie an einem blauen Raster über der Graphik. Um zwischen einer Fließtext- (roter Rahmen) und Tabellenzone (blauer Rahmen) umzuschalten, klicken Sie einfach auf die Schaltfläche Zoneneigenschaften auf der Bearbeiten-Symbolleiste. Dort werden stets die Eigenschaften der aktiven Zone angezeigt. In einer Tabelle verlaufen die waagerechten Linien stets über die gesamte Breite der Tabelle und können nicht verkürzt werden. Senkrechte Linien müssen nicht immer über die gesamte Höhe der Tabelle verlaufen: Sie können vor der Erkennung die Rasterlinien einer aktiven Tabellenzone im Bildfenster verändern. Hinweise zur Bearbeitung von Tabellen: * Standardmäßig ist eine Rasterung eingeschaltet, die die Einrichtung senkrechter Linien, die sich nicht über die gesamte Tabellenhöhe erstrecken, erleichtert. Halten Sie beim Arbeiten mit der Maus die Alt-Taste oder beide Maustasten gedrückt, um auf die Rasterung zu verzichten. * Mit Hilfe der Strg-Taste können Verschiebungen, Einfügungen und das Löschen senkrechter Linien auf die aktuelle Zeile beschränkt werden. * Wenn Sie die Strg-Taste gedrückt halten, können Sie die Maus über mehrere Zeilen hinwegziehen, um das Einfügen bzw. Löschen von Linien zu erweitern. * Rasterlinien können nicht allzu nah neben bereits vorhandenen Linien eingefügt werden. In solchen Fällen nimmt der Mauszeiger die Form eines Verbotsschildes an. Tabellen können entweder mit Hilfe der Schaltflächen auf der Bearbeiten- Symbolleiste oder mit Hilfe der Funktionen aus dem Kontextmenü des Bildfensters bearbeitet werden. Um die Rasterlinien zu verändern, muß eine Tabellenzone zunächst aktiviert werden. Sie aktivieren eine Zone, indem Sie sie einfach anklicken. Symbolleisten-Schaltflächen für die Tabellenbearbeitung: Verschieben von Rasterlinien: - Sie können eine Rasterlinie mit der Maus aufnehmen und an eine neue Position verschieben. Einfügen von Rasterlinien: 1. Klicken Sie auf Spalten einfügen bzw. Zeilen einfügen oder benutzen Sie das Kontextmenü, um den entsprechenden Mauszeiger zu erhalten. 2. Führen Sie den Mauszeiger an die gewünschte Stelle und klicken Sie, um eine Rasterlinie einzufügen. Wiederholen Sie diesen Vorgang, so oft Sie wollen. Drücken Sie Tab, um zwischen dem waagerechten und senkrechten Mauszeiger umzuschalten. 3. Um wieder den normalen Mauszeiger zu erhalten, klicken Sie außerhalb einer Zone oder drücken Sie Esc. Löschen von Rasterlinien: 1. Klicken Sie auf Zeilen/Spalten löschen oder benutzen Sie das Kontextmenü, um den entsprechenden Mauszeiger zu erhalten. 2. Um wieder den normalen Mauszeiger zu erhalten, klicken Sie außerhalb einer Zone oder drücken Sie Esc. Löschen aller Rasterlinien: - Klicken Sie auf Alle Zeilen/Spalten löschen auf der Bearbeiten- Symbolleiste oder benutzen Sie das Kontextmenü. Dadurch werden alle Rasterlinien der momentan aktiven Tabellenzone gelöscht. Die Zone bleibt jedoch auch weiterhin eine Tabellen-zone, so daß Sie nun ihre eigenen Rasterlinien einzeichnen können. Korrigieren des Textes Im Anschluß an die Erkennung wird der in einem Recognita-Dokument gespeicherte Text im Textfenster angezeigt. Außer ganz normal dargestellten Zeichen sehen Sie dabei eventuell folgende farbige Markierungen: * Verdächtige Zeichen: Zeichen, die während der OCR als unsicher markiert wurden, werden gelb dargestellt. * Nicht im Wörterbuch enthaltene Wörter: Wörter, die nicht im Wörterbuch gefunden wurden, werden grün markiert, vorausgesetzt, für die Haupterkennungssprache wurde ein Wörterbuch installiert und die Sprachanalyse war markiert. Die Markierung wird entfernt, sobald ein solches Wort verändert oder bei der Nachbearbeitung angesprungen wird. * Abgewiesene Zeichen: Zeichen, die das Programm nicht identifizieren konnte, werden durch rote Tilden (~) dargestellt. * Fehlende Zeichen (sehr selten): Zeichen, die nicht in der von Recognita Plus automatisch verwendeten Kodeseite vorkommen, werden violett dargestellt. Dies kann nur vorkommen, wenn mehrere Sprachen ausgewählt wurden und keine der Windows-Kodeseiten alle Zeichen dieser Sprachen abdeckt. * Trainierte Zeichen: Zeichen, die aufgrund von Training verändert wurden, werden blau dargestellt. Sie werden während des Trainings eingefärbt. Um derartig markierte Zeichen bzw. Wörter zu finden, müssen Sie sich nicht allein auf Ihre Augen verlassen. Für diese Zwecke stehen Ihnen in Recognita Plus folgende Funktionen zur Verfügung: * der Interne Editor, der sich an die normalen Editiertechniken hält * Bildvergleich zum Vergleichen von Text und zugehöriger Graphik * eine Nachbearbeitungsfunktion zum Suchen von problematischen Zeichen und Wörtern * Benutzerwörterbücher für die Nachbearbeitung * Training falsch erkannter Zeichen Die Markierungen von verdächtigen Zeichen und Wörtern, die nicht im Wörterbuch stehen, werden entfernt, sobald ein solches Zeichen bzw. Wort korrigiert wird. Bearbeitung Recognita Plus enthält einen internen WYSIWYG-Editor, der sowohl die üblichen als auch OCR-spezifische Funktionen bietet. In diesem Editor werden der erkannte Text und alle bei der OCR bestimmten Formatierungsattribute angezeigt. Bei der Textansicht gibt es drei verschiedene Formatierungsmodi sowie einen vierten Spezialmodus: * Volle Formatierung: in diesem Modus bleibt das Original-Seitenlayout erhalten; sowohl die Textblöcke als auch die Graphiken werden in Rahmen angezeigt. * Teilweise Formatierung: in diesem Modus werden nur Zeichen- und Absatzformatierungen angezeigt. Textspalten werden hinereinander angefügt. * Ohne Formatierung: in diesem Modus wird der Text ohne Formatierungen angezeigt. * Entwurfsmodus (selten benutzt): dieser Modus verwendet eine nichtproportionale Schrift und stellt den Text ohne Formatierungen dar. Es können alle von Recognita Plus unterstützten Zeichen gleichzeitig angezeigt werden. Dieser Modus empfiehlt sich vor allem dann, wenn unter Windows 95 die zur Textanzeige benötigten Fonts nicht installiert wurden. Anzeige des Textes in Voller, Teilweiser oder Ohne Formatierung: - Klicken Sie auf die entsprechende Schaltfläche links unten im Textfenster oder - Wählen Sie Textformatierung>Voll (Teilweise oder Ohne) aus dem Menü Ansicht. Anzeige des Textes im Entwurfsmodus: - Wählen Sie Entwurfsmodus aus dem Menü Ansicht. Anzeige des Textes in verschiedenen Vergrößerungen: - Wählen Sie im Menü Ansicht oder im Kontextmenü des Textfensters die gewünschte Prozentzahl. Veränderungen am Text vornehmen: - Es werden die meisten standardmäßig zur Textbearbeitung verwendeten Techniken unterstützt. Sie können markierte Textblöcke ausschneiden, kopieren und einfügen oder mit Hilfe von Drag-and-Drop verschieben. - Benutzen Sie die Bearbeiten-Symbolleiste, um die Zeichenformatierung zu ändern. - Benutzen Sie die Bearbeiten-Symbolleiste und das Lineal, um die Absatzformatierungen zu ändern. Bevor Sie anfangen, den erkannten Text zu verändern, sollten Sie ihn zunächst korrigieren und, falls notwendig, ein Training durchführen, da die Verknüpfungen zwischen Text und Bild bei geänderten Zeichen eventuell nicht mehr funktionieren. Bearbeiten von Tabellen Nachdem der Inhalt einer Tabellenzone erkannt wurde, können Sie das Raster und den Inhalt im Textfenster bearbeiten. Recognita Plus hält sich dabei an die üblichen Konventionen zur Tabellenverarbeitung. Die folgende Abbildung zeigt eine Übersicht über alle Methoden zur Zellenmarkierung und Bearbeitung der Rasterlinien: Um mehrere Zeilen, Spalten oder Zellen auf einmal zu markieren, führen Sie die Maus bei gedrückt gehaltener Maustaste über den zu markierenden Bereich. Mit Hilfe des Kontextmenüs im Textfenster können Sie die Zellen bearbeiten: * Benutzen Sie Zellen teilen, um alle markierten Zellen in zwei Teile zu teilen. Auf diese Weise können Sie rechts neben einer markierten Spalte eine neue Spalte einfügen. * Benutzen Sie Zellen verbinden, um alle markierten Zellen innerhalb einer Zeile zu verbinden. * Benutzen Sie Zeilen einfügen, um leere Zeilen vor den markierten Zeilen einzufügen. Es werden soviele Zeilen eingefügt, wie momentan markiert sind. * Benutzen Sie Zeilen löschen, um die markierten Zeilen zu löschen. Weitere Hinweise zur Bearbeitung: * Möchten Sie am Ende der Tabelle eine neue Zeile einfügen, klicken Sie in die rechte untere Zelle und drücken Sie Tab. * Möchten Sie in eine Zelle einen Tabulator einfügen, drücken Sie Strg+Tab. * Drücken Sie Entf, um den Inhalt markierter Zellen zu löschen. Bildvergleich Recognita Plus speichert für jedes erkannte Zeichen eine Verknüpfung zu dem zugehörigen Bildausschnitt. Mit Hilfe der Bildvergleichs-funktionen können diese Ausschnitte angezeigt werden, um die Korrektur des erkannten Textes zu erleichtern. Popup-Bildvergleich: Doppelklicken Sie auf das zu überprüfende Zeichen. Das angeklickte Wort und dessen Nachbarwörter werden in einem kleinen Popup-Fenster angezeigt. Klicken Sie in dieses Fenster, um es wieder zu schließen. Dynamischer Bildvergleich: Klicken Sie in den Text, um dieses Fenster zu öffnen. Die Anzeige ist die gleiche wie beim Popup-Bildvergleich, aber das Fenster bleibt ständig geöffnet und zeigt die aktuelle Textposition an. Bildfenstervergleich: Zeichen, die im Textfenster angeklickt wurden, werden im Bildfenster blau eingerahmt. Der Rahmen wandert mit der aktuellen Textposition. Ändern Sie die Anzeigevergrößerung, um mehr oder weniger vom umgebenden Text zu sehen. In der Abbildung sehen Sie beide Bildvergleichsfunktionen: Nachbearbeitung Recognita Plus bietet Ihnen eine spezielle Suchen-und-Ersetzen-Funktion zur Nachbearbeitung des erkannten Textes. Diese hilft Ihnen beim Suchen und Ersetzen von: * Verdächtigen Zeichen (gelb markiert) * Während der Erkennung nicht im Wörterbuch gefundenen Wörtern (grün markiert) * Während der Nachbearbeitung gefundenen Wörtern, die nicht im Wörterbuch stehen * Abgewiesenen Zeichen (standardmäßig eine rote Tilde) * durch Training veränderten Zeichen (blau) * Benutzerdefinierten Zeichenketten (z.B. wiederholt falsch interpretierte Zeichenpaare) Die bei der Nachbearbeitung verwendete Sprache und die verschiedenen Stopkriterien können im Reiter Nachbearbeitung im Optionen-Dialogfenster eingestellt werden. Standardmäßig wird bei der Nachbearbeitung dieselbe Sprache wie bei der Erkennung verwendet. Diese kann vor oder während der Nachbearbeitung gewechselt werden, um zum Beispiel verschiedene Abschnitte eines mehrsprachigen Dokuments zu kontrollieren. Sobald bei der Nachbearbeitung das Ende der Seite erreicht und die nächste Seite geladen wird, wird die korrigierte Seite als korrigiert markiert. Dies wird durch ein Häkchen in der Spalte Korrigiert des Seiten-Browsers angezeigt. Wurde eine Seite einmal als korrigiert markiert, wird sie in Zukunft bei der Nachbearbeitung übergangen. Sie können diese Markierung selber setzen bzw. wieder entfernen, indem Sie im Kontextmenü des Browsers die Funktion Korrigiert an/aus aufrufen. Wird die Markierung entfernt, werden erneut alle verdächtigen Zeichen und nicht im Wörterbuch enthaltenen Wörter auf der Seite markiert, und Sie können Sie erneut nachbearbeiten. Starten (und Beenden) der Nachbearbeitung: - Klicken Sie auf Nachbearbeitung auf der Hauptsymbolleiste oder wählen Sie Nachbearbeitung aus dem Menü Bearbeiten. Am unteren Rand des Textfensters erscheint eine Dialogzeile für die Nachbearbeitung. Suchen einer problematischen Stelle im Text: - Klicken Sie in der Dialogzeile auf Weitersuchen. Falls nicht abgeschaltet, wird der Bildvergleich für das gefundene Zeichen bzw. Wort angezeigt. Korrektur gefundener Wörter mit Hilfe der Dialogzeile: - Wählen Sie aus der Liste einen Vorschlag aus und klicken Sie auf Ersetzen (diese Funktion steht nur dann zur Verfügung, wenn eine Sprache ausgewählt wurde) oder - Geben Sie Ihre Korrekur in das Feld Ersetzen durch ein und klicken Sie auf Ersetzen oder - Klicken Sie auf Hinzufügen, um den ausgewählten Vorschlag bzw. das korrigierte Wort in das Benutzerwörterbuch aufzunehmen. Weitere Informationen zu Benutzerwörterbüchern finden Sie unter "Benutzerwörterbücher" später in diesem Kapitel. - Klicken Sie auf Training, um das gefundene Zeichen zu trainieren. Weitere Informationen zum Training finden Sie unter "Trainieren von Zeichen" später in diesem Kapitel. Anstatt Ersetzen können Sie auch Alle Ersetzen verwenden, um alle Vorkommen eines nicht im Wörterbuch stehenden Wortes durch das eingegebene korrekte Wort ersetzen zu lassen. Korrigieren gefundener Wörter mit Hilfe des Editors: - Drücken Sie Esc, wenn ein Wort gefunden wurde, um die Einfügemarke von der Dialogzeile zum gefundenen Wort im Textfenster springen zu lassen. Drücken Sie zweimal Esc, falls gerade die Vorschlagsliste aufgeklappt ist. So erhalten Sie Vorschläge zu einem Wort im Editor: 1. Starten Sie die Nachbearbeitung. 2. Markieren Sie im Editor das Wort, zu dem Sie sich Vorschläge anzeigen lassen möchten. Die Schaltfläche Hinzufügen wird daraufhin Vorschlag anzeigen. 3. Klicken Sie auf Vorschlag, um sich Vorschläge anzeigen zu lassen. Benutzerwörterbücher Zusätzlich zu dem Hauptwörterbuch, das bei der Erkennung und Nachbearbeitung verwendet werden kann, können Sie sich eigene Benutzerwörterbücher erstellen, indem Sie während der Nach-bearbeitung eins anlegen und Wörter hinzufügen. Benutzerwörterbücher können zwecks späterer Benutzung in Dateien gespeichert werden. Pro Dokument kann ein Benutzerwörterbuch geladen werden. Ist kein Benutzerwörterbuch geladen, werden die hinzugefügten Wörter solange im Hauptspeicher gehalten, bis sie gespeichert werden. Die geladenen bzw. neuen Wörterbuchinformationen werden sowohl bei der Erkennung als auch bei der Nachbearbeitung verwendet. Name und Zustand des zur Zeit geladenen Benutzerwörterbuches werden in der Statuszeile angezeigt. Wenn Sie mit der rechten Maustaste auf das Benutzerwörterbuchfeld der Statuszeile klicken, erhalten Sie ein Kontextmenü mit Funktionen zum Laden, Speichern und Entfernen von Benutzerwörterbüchern. Bearbeitung eines Benutzerwörterbuches: 1. Laden Sie das Benutzerwörterbuch. (Sie können auch Wörter editieren, die während der Nachbearbeitung hinzugefügt aber noch nicht gespeichert wurden.) 2. Wählen Sie Benutzerwörterbuch bearbeiten aus dem Menü Bearbeiten. Es erscheint das Dialogfenster "Benutzerwörterbuch bearbeiten". 3. Um ein Wort hinzuzufügen, geben sie es in das Textfeld am unteren Fensterrand ein und klicken Sie auf Hinzufügen. 4. Um ein Wort zu löschen, markieren Sie es in der Liste und klicken Sie auf Löschen. Hinzufügen von Wörtern während der Nachbearbeitung: - Klicken Sie in der Dialogzeile auf Hinzufügen, wie im vorangegangenen Abschnitt beschrieben. Speichern/Laden/Entfernen eines Benutzerwörterbuches: - Benutzen Sie den entsprechenden Menüpunkt aus dem Kon-textmenü oder aus dem Untermenü Benutzerwörterbuch im Menü Datei. - Benutzerwörterbücher können auch durch Anklicken der Schaltfläche mit den drei Punkten (‘...’) im Reiter Genauigkeit des Optionen-Dialogfensters geladen werden. Training Beim Training können bestimmten Zeichenformen (Graphiken) die Zeichen zugewiesen werden, die sie darstellen. Training kann nach der Erkennung mit allen Omnifont- bzw. Nadeldruckzeichen durchgeführt werden. Die meisten Zeichen müssen nicht trainiert werden. Sie sollten auch nur solche Zeichenformen trainieren, die wiederholt falsch interpretiert oder gar nicht erkannt wurden. Oder in anderen Worten: trainieren Sie keine Zeichen, die durch Einzelfehler wie zufällig auf dem Bild verstreute Punkte verursacht wurden. Sie können auch ungewöhnliche Symbole und Sonderzeichen trainieren. Das Training kann für eine spätere Benutzung in der Trainingsdatei gespeichert und später jederzeit wieder geladen werden. Wurde keine Trainingsdatei geladen, werden die neuen Trainingsdaten solange im Hauptspeicher gehalten, bis sie gespeichert werden. Geladenes und neues Training werden bei der Erkennung stets berücksichtigt. Falls die Trainingsdaten nicht mehr länger benötigt werden, können Sie das Training aus dem Speicher entfernen lassen. Trainingsdateien können auch nachträglich überprüft und editiert werden. Name und Zustand der zur Zeit geladenen Trainingsdatei werden in der Statuszeile angezeigt. Wird eine Zeichenform trainiert, tut das Programm folgendes: * Es korrigiert das für das Training benutzte Zeichen. * Es durchsucht den Rest der Seite nach Zeichen, die dem trainierten Zeichen ähnlich sehen. * Es zeigt Vorschläge für Änderungen zur Bestätigung an. * Bei Bestätigung korrigiert es alle Vorkommen ähnlicher Zeichen. Hinweise zum Training: * Beginnen Sie mit dem Training stets am Dokumentanfang. * Verwenden Sie nur einige wenige Seiten für das Training. Durch das Training wird die Erkennungsgenauigkeit bei neu hinzukommenden Seiten erhöht. * Verwenden Sie für verschiedene Dokumenttypen getrennte Trainingsdateien. * Selbst wenn Sie Ihr Training nicht speichern möchten, kann es durchgeführt werden, um die Nachbearbeitung zu beschleunigen. Wenn Sie mit der rechten Maustaste auf das Trainingsfeld der Statuszeile klicken, erhalten Sie ein Kontextmenü mit Funktionen zum Laden, Speichern und Entfernen von Trainingsdateien. Trainieren von Zeichen: 1. Um ein Training zu beginnen, gibt es folgende Möglichkeiten: - Klicken Sie in der Dialogzeile auf Training, falls Sie ein markiertes Zeichen trainieren möchten oder - Klicken Sie im Editor mit der rechten Maustaste auf ein Zeichen oder ein markiertes Wort und wählen Sie Training aus dem Kontextmenü. Es erscheint das Dialogfenster Training: 2. Geben Sie das richtige Zeichen in das Textfeld ein und klicken Sie auf Trainieren. 3. Falls das Programm ähnlich aussehende Zeichen auf derselben Seite findet, erscheint das Dialogfenster "Training überprüfen". 4. Überprüfen Sie, ob alle vorgeschlagenen Änderungen korrekt sind. Einige von ihnen sind eventuell aufgrund von ähnlichen Zeichenformen nicht korrekt. (Zum Beispiel: ‘b’ und ’h’, ‘q’ und ‘g’, usw.) Sie haben folgende Möglichkeiten: - Sind alle Wörter korrekt, so klicken Sie auf OK. Die vorgeschlagenen Änderungen werden vorgenommen; die geänderten Zeichen werden blau dargestellt. - Sind nur einige Vorschläge inkorrekt, markieren Sie ein inkorrektes Wort, und klicken Sie auf Neu trainieren. Es erscheint erneut das Trainings- Dialogfenster, in dem Sie dieses Zeichen wieder trainieren können. Wiederholen Sie diesen Schritt so oft wie nötig und klicken Sie dann auf OK. - Sind viele Vorschläge inkorrekt, sollten Sie weder OK noch Neu trainieren sondern Abbrechen wählen. Das Training wird daraufhin abgebrochen. Speichern/Laden/Entfernen von Trainingsdateien: - Benutzen Sie den entsprechenden Menüpunkt aus dem Kontextmenü oder aus dem Untermenü Training im Menü Datei. - Trainingsdateien können auch durch Anklicken der Schaltfläche mit den drei Punkten (‘...’) im Reiter Genauigkeit des Optionen-Dialogfensters geladen werden. Kontrollieren/Bearbeiten von Trainingsdaten: 1. Laden Sie die Trainingsdatei. (Sie können auch noch nicht gespeichertes Training bearbeiten.) 2. Wählen Sie Trainingsdatei bearbeiten aus dem Menü Bearbeiten. Es erscheint das Dialogfenster "Trainingsdatei bearbeiten". 3. Im Dialogfenster werden die trainierten Zeichenformen zusammen mit den zugewiesenen Zeichen angezeigt. Sie können neue Zuweisungen vornehmen oder ungeeignete Zeichen löschen. Navigieren in Recognita-Dokumenten Recognita Plus zeigt stets nur eine Seite eines Recognita-Dokuments auf einmal an - diese wird auch als die aktuelle Seite bezeichnet. Mit Hilfe des Seiten- Browser’s können Sie die Seiten hintereinander oder auch wahllos ansteuern. Mit Hilfe anderer Funktionen können Sie das Dokument nach bestimmten Seiten durchsuchen. Zur weiteren Erleichterung können für jede Seite kurze Beschreibungen angezeigt werden. Seiten können auf ganz einfache Art und Weise innerhalb eines Dokuments oder zwischen zwei verschiedenen Dokumenten verschoben bzw. kopiert werden. In diesem Abschnitt erfahren Sie, wie Sie mit mehrseitigen Dokumenten umgehen können. Folgende Themen werden behandelt: * Wechseln von Seiten * Benutzung des Browsers * Suchen von Seiten und Text Wechseln von Seiten Um die aktuelle Seite zu wechseln, können Sie die Schaltflächen in der linken unteren Ecke jedes Dokumentfensters benutzen. Hinweise zur Benutzung der Tastatur finden Sie in der Online-Hilfe. Das Textfeld in der Mitte zeigt die aktuelle Seitenzahl an. Geben Sie eine neue Zahl ein und drücken Sie Enter, um eine bestimmte Seite direkt anzuspringen. Drücken Sie Esc statt Enter, falls Sie Ihre Meinung doch noch geändert haben. Benutzung des Browsers Der Browser befindet sich stets im linken bzw. unteren Teil eines Recognita- Dokumentfensters. Er besteht aus zwei Teilen. Im linken Teil werden verkleinerte Abbilder der einzelnen Seiten angezeigt. Auf der rechten Seite finden Sie die Browser-Liste, die für jede Seite eine Zeile mit Informationen enthält. Sie können den Browser für viele verschiedene Dinge benutzen. Zusätzlich zur Anzeige von Informationen stellt er Ihnen auch ein Kontextmenü mit verschiedenen Funktionen zur Verfügung. Die meisten dieser Funktionen werden auf die markierten Seiten angewandt, zum Beispiel Erkennen, Öffnen und Löschen von Seiten, Speichern von Text und Bildern, Textsuche usw. In diesem Abschnitt werden folgende Browser-Funktionen erläutert: * Verschieben und Kopieren von Seiten: nützlich bei falscher Seitenreihenfolge. - Verschieben von Seiten an eine andere Stelle im Dokument. - Verschieben und Kopieren von Seiten in ein anderes Dokument. * Schnellanzeige des erkannten Textes: hiermit können Sie sich die Ergebnisse der Erkennung anschauen, ohne die Seite zu wechseln. * Hinzufügen von Seitennotizen: später können Sie Seiten nach bestimmten Schlüsselwörtern in ihrer Notizspalte durchsuchen. Verschieben/Kopieren von Seiten: 1. Markieren Sie die zu kopierenden/verschiebenden Seiten in der Browser- Liste. Dabei gelten die üblichen Konventionen. 2. Klicken Sie einen der markierten Einträge an und halten Sie die Maustaste gedrückt. Verschieben Sie die Seiten an ihre Zielposition im selben oder in einem anderen Dokument. Um Seiten in ein anderes Dokument zu kopieren, müssen Sie beim Loslassen der Maustaste die Strg-Taste gedrückt halten. Die momentane Zielposition wird stets durch ein Symbol wie in der Abbildung angezeigt. 3. Lassen Sie die Maustaste los, sobald Sie die gewünschte Position erreicht haben. Schnellanzeige des erkannten Textes: 1. Stellen Sie die Spalten des Browser’s so ein, daß auch die Spalte "Erkannter Text" angezeigt wird. 2. Aktivieren Sie das Browser-Fenster, indem Sie es an einer beliebigen Stelle anklicken. 3. Führen Sie den Mauszeiger auf die Spalte "Erkannter Text" und lassen Sie ihn dort stehen. Der erkannte Text (bzw. soviel davon wie möglich) erscheint daraufhin in einem kleinen Fenster wie ein ToolTip. Indem Sie sich von Zeile zu Zeile bewegen, können Sie sich sehr schnell den Text vieler Seiten anzeigen lassen. Hinzufügen von Notizen zu Seiten: 1. Stellen Sie die Spalten des Browser’s so ein, daß auch die Spalte "Notizen" angezeigt wird. 2. Sie haben folgende zwei Möglichkeiten: - Markieren Sie die Zeile der gewünschten Seite und klicken Sie das Notizenfeld an (oder drücken Sie F2), um den Notiztext einzugeben bzw. zu ändern. - Wählen Sie Notiz bearbeiten aus dem Kontextmenü des Browser’s, um sich das Dialogfenster "Notiz bearbeiten" anzeigen zu lassen. Suchen von Seiten und Text Sie können Seiten nach einer bestimmten Zeichenkette in ihrer Notizspalte oder nach Zeichenketten im erkannten Text durchsuchen lassen, ohne die Seiten vorher öffnen zu müssen. Falls Sie eine oder mehrere Seiten im Browser markiert haben und die Suche aus dessen Kontextmenü starten, werden nur die markierten Seiten durchsucht. Ansonsten werden alle Seiten durchsucht. Suchen von Seiten mit bestimmtem Text im Notizfeld: 1. Wählen Sie Suchen>In Notizen aus dem Menü Bearbeiten oder aus dem Kontextmenü des Browser’s. Es erscheint das Dialogfenster "Notizen auf allen/markierten Seiten suchen". 2. Geben Sie eine Zeichenkette ein und klicken Sie auf Weitersuchen. Die erste Seite, deren Notizfeld die gesuchte Zeichenkette enthält, wird im Browser markiert. Wiederholen Sie dies so oft, bis Sie die gewünschte Seite gefunden haben. 3. Klicken Sie auf "Alles markieren", um alle Seiten markieren zu lassen, deren Notizfeld die gesuchte Zeichenkette enthält (so daß Sie diese mit Hilfe von Drag-and-Drop alle auf einmal an eine andere Stelle verschieben können). Schnellsuche im erkannten Text: 1. Wählen Sie Suchen>Im Text aus dem Menü Bearbeiten oder aus dem Kontextmenü des Browser’s. Es erscheint das Dialogfenster "Alle/Markierte Seiten durchsuchen": 2. Geben Sie eine Zeichenkette ein und klicken Sie auf Weitersuchen. Falls die Zeichenkette gefunden wird, wird der umgebende Text angezeigt, wobei die gesuchte Zeichenkette markiert ist. Befindet sich der gesuchte Text auf der aktuellen Seite, markiert der Editor auch diese Textstelle. Ansonsten wird die Seite, die den Suchtext enthält, nur dann geöffnet, wenn Sie auf Seite öffnen klicken oder falls die Option Seiten automatisch öffnen aktiv ist. Benutzung der Zeichensatztabelle Die Zeichensatztabelle ist ein kleines Fenster, das eine Tabelle mit Zeichen anzeigt. Sie kann zwei verschiedene Formen annehmen: * Anzeige aller 464 Zeichen, die Recognita Plus erkennen kann. Normalerweise wird diese Tabelle angezeigt. Mit ihrer Hilfe können Sie Sonderzeichen in das Textfenster oder in Textfelder in Dialogfenstern einfügen. Dies ist besonders dann von Nutzen, wenn Sie Zeichen einfügen möchten, die sich nicht auf der Tastatur befinden, zum Beispiel beim Training, beim Suchen usw. * Anzeige aller Zeichen und Zeichenkodes der eingestellten Kodeseite. Diese Tabelle kann zu Informationszwecken vom Reiter Zeichen im Dialogfenster für zusätzliche Speicherungsoptionen aus aufgerufen werden. In diesem Modus werden auch die Zeichenkodes angezeigt, um Ihnen bei der Erstellung eines benutzerdefinierten Zeichensatzes zu helfen. Anzeige der Zeichensatztabelle: - Klicken Sie auf die Schaltfläche Zeichensatztabelle auf der Symbolleiste oder auf Zeichensatz in den entsprechenden Dialogfenstern. Einfügen von Zeichen aus der Zeichensatztabelle: 1. Setzen Sie die Einfügemarke an die gewünschte Textstelle (im Textfenster oder im Textfeld eines Dialogfensters). 2. Klicken Sie das Zeichen an, das Sie einfügen möchten. Es können beliebige Zeichen eingefügt werden, unabhängig von ihrer Farbe. Kapitel 5 Erhöhen der Erkennungsgenauigkeit Erfolgreiche Erkennung hängt im wesentlichen von zwei Dingen ab: der Qualität des Dokuments und den aktuellen Einstellungen von Recognita Plus. In diesem Kapitel erhalten sie einige praktische Ratschläge und erfahren, welche Einstellungen am wichtigsten sind, um die höchstmögliche Genauigkeit zu erzielen. Vergessen Sie dabei jedoch nicht, daß Ihre praktischen Erfahrungen mindestens so wichtig sind wie die richtigen Einstellungen; selbst die beste Software kommt nicht ohne sie aus. In diesem Kapitel finden Sie Informationen zu folgenden Themen: * Scannereinstellungen * Sprachen und Sprachanalyse * Probleme mit der Genauigkeit Scannereinstellungen Die Scannereinstellungen können auf dem Reiter Scanner im Optionen- Dialogfenster bzw. im TWAIN-Dialogfenster vorgenommen werden, falls als Scannertreiber "TWAIN Basic" eingestellt wurde. Die Helligkeit kann außerdem auch auf der Symbolleiste eingestellt werden. Die zur Verfügung stehenden Einstellungen sind von Scanner zu Scanner unterschiedlich. Die wichtigsten sind: * Helligkeit * Auflösung * Scan-Modus Einstellen der richtigen Helligkeit Eine optimale Helligkeitseinstellung führt zu Zeichen, deren Konturen weder aufgerissen sind noch ineinander verlaufen. Bei Dokumenten guter Qualität liefert die Standardeinstellung (für gewöhnlich 50%) die besten Ergebnisse. Sie können die Bildqualität im Bildfenster bei maximaler Vergrößerung überprüfen. Ein mit verschiedenen Helligkeitswerten eingescannter Beispieltext: Sie sollten selbstverständlich stets versuchen, die optimale Bildqualität zu erreichen. Leider ist dies nicht immer möglich. Da Recognita Plus unterbrochene Linien und sich berührende Zeichen bis zu einem gewissen Grad toleriert, sollten Sie sich jedoch nicht allzu viele Sorgen machen. Mit Hilfe der Sprachanalyse können Sie selbst bei nicht so guter Bildqualität noch gute Ergebnisse erzielen. Nähere Informationen zu den Spracheinstellungen erhalten Sie im folgenden Abschnitt. Einstellen der richtigen Auflösung Um gute Ergebnisse erzielen zu können, ist eine gute Auflösung ebenfalls notwendig. Obwohl hierbei auch die Dokumentqualität eine Rolle spielt, sollten Sie sich an folgende Richtlinien halten: * 300 dpi für Buchstaben größer als 8 Punkt Schriftgröße, * 400 dpi für Buchstaben kleiner/gleich 8 Punkt Schriftgröße. Stellen Sie die Auflösung nicht höher als auf 400 dpi ein, da dies ansonsten eventuell mehr Schaden anrichtet als Nutzen bringt. Überprüfen Sie die Auflösung von Bilddateien. Lassen Sie dazu die Spalte Auflösung in der Browser-Liste einblenden. Einstellung des richtigen Scan-Modus Recognita Plus bietet vier verschiedene Scan-Modi zur Auswahl: * S/W scannen: wird am häufigsten verwendet. Es wird in schwarzweiß mit der eingestellten Helligkeit gescannt. Verwenden sie diese Funktion bei Dokumenten guter Qualität. * S/W scannen mit Auto-Helligkeit: es wird in Graustufen gescannt und entweder eine scannereigene Optimierungsroutine oder die entsprechende Funktion von Recognita verwendet, um ein opti-males Schwarzweißbild abzuleiten. Das Graustufenbild wird nicht aufbewahrt. Verwenden Sie diese Einstellung nur bei Dokumenten schlechter Qualität mit variierendem Kontrast. * Scannen in Graustufen: Dieser Modus wird hauptsächlich dazu verwendet, um Graustufengraphiken in Dokumente einzufügen. Für die Erkennung wird ähnlich wie beim Schwarzweiß-Scannen mit Auto-Helligkeit ein optimales Schwarzweißbild abgeleitet.* * Scannen in Farben: Diese Option wird angeboten, wenn Ihr Scanner das Scannen im Farbmodus unterstützt. Mit Hilfe dieser Funktion können im Bild- und im Browser-Fenster Farbgraphiken dargestellt werden. Diese Graphiken können gedruckt, versendet oder als Bilddateien abgespeichert werden. Beim Scannen im Farbmodus wird der Inhalt von Graphikzonen im Textfenster farbig angezeigt, wenn Volle Formatierung eingestellt wurde. Graphikzonen können auch in Farbe gedruckt werden. Eine Speicherung als Farbbilddatei ist ebenfalls möglich, vorausgesetzt die Option Graphiken aufbewahren ist aktiv und es wurde ein passendes Dateiformat ausgewählt. Sprachen und Sprachanalyse In diesem Abschnitt erhalten Sie Informationen zu folgenden Themen: * Erkennungssprachen * Sprachanalyse (unter Zuhilfenahme von Wörterbüchern) * Schriftartenunabhängige Erkennungsmethoden Erkennungssprachen Es ist sehr wichtig, daß vor der Erkennung eingestellt wird, welche Zeichen zugelassen sein sollen. Normalerweise tun Sie dies, indem Sie die Sprache Ihres Dokuments einstellen. Diese Einstellung bestimmt, wie die Zeichen erkannt werden. Sprachen für die Erkennung können Sie in der Liste auf der Symbolleiste oder auf dem Reiter Genauigkeit im Optionen-Dialogfenster einstellen. Wenn Sie eine Sprache einstellen, fügen Sie der Menge der zugelassenen Zeichen alle Zeichen dieser Sprache hinzu. Diese Menge wird Sprachauswahl genannt. Indem Sie mehrere Sprachen auf einmal auswählen, können Sie diese Menge für ein mehrsprachiges Dokument erweitern. Interpunktionszeichen, Zahlen und andere Sonderzeichen sind stets zugelassen. Falls mehrere Sprachen ausgewählt wurden, muß eine davon zur Hauptsprache deklariert werden. Steht für diese Sprache ein Wörterbuch zur Verfügung, kann die Sprachanalyse verwendet werden. Die Haupterkennungssprache wird auch benutzt, um eine geeignete Kodeseite für den Textexport zu finden. Die Menge aller Ziffern, genannt "Nur Zahlen", ist eine Alternative zur Sprachauswahl für den Fall, daß Ihr Dokument hauptsächlich Zahlen enthält. Beide Einstellungen können durch Eingabe zusätzlicher Zeichen erweitert werden. Um zu sehen, welche Zeichen für die einzelnen Sprachen zugelassen sind, schauen Sie unter "Sprachen und Akzentzeichen" in der Online-Hilfe nach. Im dortigen Abschnitt zu den Sprachen finden Sie auch Hinweise zum Umgang mit mehrsprachigen Dokumenten sowie zu Kodeseiten für den Textexport. Anpassung der Sprachenliste Diese Funktion ist neu in Recognita Plus 5.0. Standardmäßig enthält die Sprachenliste der Symbolleiste die 16 Sprachen, für die eine Sprachanalyse zur Verfügung steht. Um die Liste zu verändern, haben Sie folgende Möglichkeiten: 1. Rufen Sie im Dialogfenster Optionen den Reiter Genauigkeit auf. 2. Klicken Sie auf Sprachliste anpassen..., um sich eine alphabetische Liste aller 114 unterstützten Sprachen anzeigen zu lassen. 3. Verkürzen Sie, falls nötig, die Liste, indem Sie alle nicht benötigten Sprachen demarkieren. 4. Markieren Sie Sprachen in einer der beiden Listen und klicken Sie auf Hinzufügen bzw. Entfernen, um nur die benötigten Sprachen in die Sprachenliste aufzunehmen. Hinzugefügte Sprachen erscheinen am Ende der Liste. 5. Um die Liste umzuordnen, markieren Sie eine Sprache und verschieben Sie sie mit Hilfe der Pfeilschaltflächen. Sprachanalyse (mit Hilfe von Wörterbüchern) Die Sprachanalyse beinhaltet die Verwendung von Wörterbüchern bei der Erkennung. Wird sie verwendet, zieht die Omnifont-OCR während der Erkennung das Wörterbuch der Haupterkennungssprache sowie - falls geladen - das aktuelle Benutzerwörterbuch zu Rate, um die erkannten Wörter zu überprüfen und zu korrigieren. Mit Hilfe des Wörterbuches können auch Wörter im erkannten Text markiert werden, die nicht im Wörterbuch gefunden wurden. Mehr zur Benutzung der Sprachanalyse erfahren Sie im nächsten Abschnitt "Schriftartenunabhängige Erkennungsmethoden". Schriftartenunabhängige Erkennungsmethoden Die Omnifont-Erkennungsfunktion verfügt über sechs verschiedene Genauigkeits- /Geschwindigkeitsmethoden, mit deren Hilfe Sie bestimmen können, wieviele Erkennungsdurchgänge für jede Seite durchzuführen sind und ob eine Sprachanalyse benutzt werden soll. Die sechs Erkennungsmethoden: Die Erkennungsmethode kann auf der Symbolleiste oder auf dem Reiter Genauigkeit im Optionen-Dialogfenster eingestellt werden. * Stufe 1: Einstufiges Lesen ohne Sprachanalyse. Dies ist die schnellste Methode. Verwenden Sie sie: - bei Dokumenten sehr guter Qualität, - wenn Geschwindigkeit wichtiger ist als Genauigkeit. * Stufe 2: Einstufiges Lesen mit Sprachanalyse. Verwenden sie es: - bei Dokumenten guter Qualität ohne Fachtexte, - bei Seiten, die nur sehr wenig Text enthalten, - wenn Geschwindigkeit etwas wichtiger ist als Genauigkeit. * Stufe 3: Zweistufiges Lesen ohne Sprachanalyse. Wird auch als Ausgewogenes Lesen bezeichnet. Zu verwenden bei: - typischen Dokumenten vernünftiger Qualität, - Sprachen, für die kein Wörterbuch zur Verfügung steht, - Dokumenten mit vielen Eigennamen oder Begriffen, die nicht im Wörterbuch stehen, - Seiten mit mehr als zwei Sprachen. * Stufe 4: Zweistufiges Lesen mit Sprachanalyse. Zu verwenden bei: - typischen Dokumenten vernünftiger Qualität, - Dokumenten mit nicht allzu vielen Eigennamen oder Begriffen, die nicht im Wörterbuch stehen. * Stufe 5: Dreistufiges Lesen mit Sprachanalyse. Genaueste Methode mit einer Erkennungs-Engine. Verwenden Sie es: - bei Dokumenten schlechter Qualität - bei Sprachen mit Sprachanalyse, die von der zweiten Engine nicht unterstützt werden: Griechisch, Katalanisch, Polnisch Russisch, Tschechisch und Ungarisch * Stufe 6: Genauestes dreistufiges Lesen mit Sprachanalyse und zwei Erkennungs-Engines. Verwenden Sie es: - wenn maximale Genauigkeit sehr wichtig ist und langsamere Verarbeitung keine Rolle spielt, - auf sehr schnellen Computern, - bei Sprachen, die von beiden Engines unterstützt werden: Dänisch, Deutsch, Englisch, Finnisch, Französisch, Italienisch, Niederländisch, Norwegisch, Portugiesisch, Spanisch oder Schwedisch. Probleme mit der Genauigkeit Unerwartet schlechte oder inkorrekte Erkennungsergebnisse können viele Ursachen haben. In diesem Abschnitt werden einige Probleme und ihre möglichen Ursachen beschrieben. Die meisten davon können durch veränderte Einstellungen und erneutes Lesen behoben werden. Schlechte Erkennung: * Schlechte Bildqualität aufgrund falscher Einstellungen für Helligkeit oder Auflösung. Viele grüne Markierungen, obwohl die Wörter richtig sind: * Sprachanalyse wurde mit falscher Sprache verwendet. * Falsches oder fehlendes Benutzerwörterbuch. Viele falsche Zeichen, die früher richtig erkannt wurden * Falsche oder fehlende Trainingsdatei. * Früher zusätzlich aktivierte Zeichen sind nicht mehr eingestellt. Fehlende Akzente oder falsch erkannte Akzentzeichen: * Falsche Sprache war eingestellt. Viele unsinnige Wörter und Schmutzzeichen: * Falsche Erkennungsfunktion verwendet (z.B. Nadeldruck statt Omnifont oder umgekehrt) oder die automatische Bestimmung des Zonentyps funktionierte nicht richtig. * Seitenlage ist falsch. Entweder haben Sie die Seite falsch herum in den Scanner eingelegt, oder die automatische Bestimmung der Seitenlage hat einen Fehler begangen. Sie können das Bild drehen und erneut erkennen lassen. Schmutzzeichen in bestimmten Zeilen: * Falsch plazierte Zonen schneiden einen Teil der Zeile ab. * Falsch plazierte Rasterlinien in einer Tabellenzone. * Ungeeignete Rändereinstellungen unter Extras/Optionen/Bereich. Text enthält hauptsächlich Zahlen und Abweisungen: * Omnifont-, Braille- oder Nadeldruckerkennung wurde bei Zonen mit normalem Text durchgeführt, aber die Option "Nur Zahlen" war eingestellt, oder die Funktion zur Erkennung handgeschriebener Zahlen wurde mit normalem Text verwendet. Wir hoffen, daß Recognita Plus Sie bei Ihrer Arbeit begleiten und Ihnen gute Dienste leisten wird. Vergessen Sie nicht die verschiedenen Hilfemöglichkeiten, die Ihnen zur Verfügung stehen: * dieses Benutzerhandbuch * die Online-Hilfe * Homepage: www.caere.com/recognita * Fax: (+36 1) 452-3710 * Tel.: (+36 1) 452-3706 Wir empfehlen Ihnen, Ihre Registriernummer in folgendes Kästchen einzutragen, sobald Sie sie von uns erhalten haben, so daß Sie sie beim Anrufen unserer Support-Abteilung sofort zur Hand haben. Registriernummer: © Recognita AG, 1999 Dieses Software Produkt ist urheberrechtlich geschützt und alle Rechte sind der Recognita AG vorbehalten. Recognita und Recognita Plus sind registrierte Handelsmarken der Recognita AG. Alle Handelsmarken sind anerkannt. Verwendete Rechtschreibkorrektursysteme Rechtschreibkorrektursysteme International CorrectSpell TM Rechtschreibkontrolle für Dänisch. © 1995 by INSO Corporation. Alle Rechte vorbehalten. Einige Teile stammen vom The Orthographical Dictionary, 5th Ed. 1988, by the Danish Language Council. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Englisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Finnisch. © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nach einer Wörterliste von University of Helsinki Institute for Finnish Language und Dr. Kolbjorn Heggstad. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Französisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nach einer Wörterliste von Librairie Larousse. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM German Rechtschreibkontrolle © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nach einer Wörterliste der Langenscheidt K.G. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. © Licensee and others. 1995. International CorrectSpell TM Rechtschreibkontrolle für Griechisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Holländisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Italienisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nach einer Wörterliste von Zanichelli S.p.A. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Katalanisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Angepaßt von katalanischer Wörterliste © 1992 Universitat de Barcelona. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Norwegisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Polnisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Einige Teile der Technologie und Wörterliste stammen von Morphologic. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Portugiesisch. © 1995 by INSO Corporation. Alle Rechte vorbehalten. Einige Teile stammen vom Dicionario Academico da Lingua Portuguesa. © 1992 by Porto Editora. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Schwedisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Spanisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nach einer Wörterliste von Librairie Larousse. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Tschechisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nach einer Wörterliste von Jan Hajic. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten International CorrectSpell TM Rechtschreibkontrolle für Russisch. © 1995 by INSO Corporation. Alle Rechte vorbehalten. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. International CorrectSpell TM Rechtschreibkontrolle für Ungarisch © 1995 by INSO Corporation. Alle Rechte vorbehalten. Einige Teile der Technologie und Wörterliste stammen von Morphologic. Nachbildung oder Disassemblierung der verwendeten Algorithmen und Datenbanken verboten. Inhaltsverzeichnis Willkommen Kapitel 1 Installation und Einrichtung 5 Systemanforderungen 6 Installation 7 Einrichtung des Scanners für Recognita Plus 9 Andern der Scanner-Einrichtungen 10 Einrichtung TWAIN-kompatibler Scanner: 12 Spezielle Scannerprobleme unter Windows 95 und 98 14 Registrierung 16 Kapitel 2 Einführung in Recognita Plus 19 Worum geht es bei OCR eigentlich? 20 Verarbeitungsphasen in Recognita Plus 21 Das Recognita-Dokument 23 Programm- und Dokumentfenster 24 Benutzung der Elektronischen Online-Hilfe 25 Was ist neu im Vergleich zu Version 4.0? 26 Produkt-Support 29 Kapitel 3 Verarbeiten von Dokumenten 31 Überblick über die Verarbeitung 32 Erstellen von Dokumenten 33 Unterbrechen und Fortsetzen der Verarbeitung 36 Erkennen von Bildern in einem Dokument 38 Arbeiten mit Dokumenten 39 Speichern von Dokumenten, Text und Bildern 40 Speichern und Senden von Dokumenten 40 Speichern und Senden von Text 41 Zusätzliche Einstellungen bei der Textausgabe 43 Speichern und Senden von Bildern 44 Benutzung von Drag-and-Drop und der Zwischenablage 46 Starten der Erkennung aus anderen Anwendungen heraus 47 Direktverbindungen zu anderen Anwendungen 47 Erkennungsfunktionen in Mail-Programmen 48 Menüpunkte im Kontextmenü des Explorer's 49 Drag-and-Drop aus dem Explorer heraus 50 Verarbeiten und Speichern ohne Anzeige 50 Kapitel 4 Arbeiten mit Dokumenten 53 Arbeiten mit Zonen 54 Automatische oder Manuelle Zoneneinrichtung 55 Grundlagen der Manuellen Zoneneinrichtung 55 Grundlagen der Zoneneigenschaften 56 Grundlagen der Zonenschablonen 59 Arbeiten mit Tabellenzonen 61 Korrigieren des Textes 64 Bearbeitung 65 Bearbeiten von Tabellen 66 Bildvergleich 67 Nachbearbeitung 68 Benutzerwörterbücher 71 Training 72 Navigieren in Recognita-Dokumenten 76 Wechseln von Seiten 76 Benutzung des Browsers 77 Suchen von Seiten und Text 79 Benutzung der Zeichensatztabelle 81 Kapitel 5 Erhöhen der Erkennungsgenauigkeit 83 Scannereinstellungen 84 Einstellen der richtigen Helligkeit 84 Einstellen der richtigen Auflösung 85 Einstellung des richtigen Scan-Modus' 85 Sprachen und Sprachanalyse 86 Erkennungssprachen 86 Anpassung der Sprachenliste 87 Sprachanalyse (mit Hilfe von Wörterbüchern) 87 Schriftartenunabhängige Erkennungsmethoden 88 Probleme mit der Genauigkeit 91 Die Informationen in diesem Handbuch unterliegen unangekündigten Änderungen.